李宏毅2017听课笔记0

前言

之前听了吴恩达2014大部分的课以及吴恩达最近在网易云上的CNN课程。
听闻李宏毅的课程不错，主要比较系统全面，来听一哈喽。
不错的博客

0-1Introduction

找出function

准备一个function set (model)
机器决定function们的好坏
找出最好的function

Deep Learning：
分类，非线性

Learning Map

Reinforcement Learning
在实际运用中，以上方法并不能解决全部问题，常常会遇到Beyond Classification的情况，比如语音识别，人脸识别，语言翻译等，那么就要通过增强学习来解决问题。
增强学习的一个非常知名的应用就是 google 阿法狗。

Reinforcement Learning VS Supervised
Supervised 就像给了机器一个点读机，他听到一句话时可以看到其含义，每一句话都有标签，就像有一个手把手教他的老师。
而Reinforcement Learning 就像跟女朋友对话，反复讲来回讲很多句话，直到女朋友觉得你无言以对愤然离去，机器唯一可以知道的就是他做的好还是不好，除此之外没有任何information。而这更像人类现实生活中的学习过程，必须自己像哪里做得好做得不够好，怎么修正。

Learning Map:

scenario:学习情景，不受自己控制。意思是你现在有什么类型的 training data。

machine learning	scenario
Supervised Learning	有标签data
Semi-supervised Learning	部分有标签data
Unsupervised Learning	无标签data
Transfer Learning	一堆不相干data
Reinforcement Learning	只有来自外界的评价

task，意思是现在function的output是什么，只体现在supervised中，但其实可以插在以上五种Learning的每一种内。

machine learning	task(output)
Regression	scalar
Classification	class1、class2…之一
Structured Learning	有结构的内容

Method方法模型，比如在Classification中有Linear模型 or Non-linear模型，我们可以将绿色部分插入任何红色部分中。