李宏毅2017听课笔记0

前言

之前听了吴恩达2014大部分的课以及吴恩达最近在网易云上的CNN课程。
听闻李宏毅的课程不错,主要比较系统全面,来听一哈喽。
不错的博客

0-1Introduction

找出function

  • 准备一个function set (model)
  • 机器决定function们的好坏
  • 找出最好的function

Deep Learning
分类,非线性

Learning Map

Reinforcement Learning
在实际运用中,以上方法并不能解决全部问题,常常会遇到Beyond Classification的情况,比如语音识别,人脸识别,语言翻译等,那么就要通过增强学习来解决问题。
增强学习的一个非常知名的应用就是 google 阿法狗。

Reinforcement Learning VS Supervised
Supervised 就像给了机器一个点读机,他听到一句话时可以看到其含义,每一句话都有标签,就像有一个手把手教他的老师。
而Reinforcement Learning 就像跟女朋友对话,反复讲来回讲很多句话,直到女朋友觉得你无言以对愤然离去,机器唯一可以知道的就是他做的好还是不好,除此之外没有任何information。而这更像人类现实生活中的学习过程,必须自己像哪里做得好做得不够好,怎么修正。

Learning Map:

scenario:学习情景,不受自己控制。意思是你现在有什么类型的 training data。

machine learning scenario
Supervised Learning 有标签data
Semi-supervised Learning 部分有标签data
Unsupervised Learning 无标签data
Transfer Learning 一堆不相干data
Reinforcement Learning 只有来自外界的评价

task,意思是现在function的output是什么,只体现在supervised中,但其实可以插在以上五种Learning的每一种内。

machine learning task(output)
Regression scalar
Classification class1、class2…之一
Structured Learning 有结构的内容

Method方法模型,比如在Classification中有Linear模型 or Non-linear模型,我们可以将绿色部分插入任何红色部分中。