李宏毅2017听课笔记0
前言
之前听了吴恩达2014大部分的课以及吴恩达最近在网易云上的CNN课程。
听闻李宏毅的课程不错,主要比较系统全面,来听一哈喽。
不错的博客
0-1Introduction
找出function
- 准备一个function set (model)
- 机器决定function们的好坏
- 找出最好的function
Deep Learning:
分类,非线性
Learning Map
Reinforcement Learning
在实际运用中,以上方法并不能解决全部问题,常常会遇到Beyond Classification的情况,比如语音识别,人脸识别,语言翻译等,那么就要通过增强学习来解决问题。
增强学习的一个非常知名的应用就是 google 阿法狗。
Reinforcement Learning VS Supervised
Supervised 就像给了机器一个点读机,他听到一句话时可以看到其含义,每一句话都有标签,就像有一个手把手教他的老师。
而Reinforcement Learning 就像跟女朋友对话,反复讲来回讲很多句话,直到女朋友觉得你无言以对愤然离去,机器唯一可以知道的就是他做的好还是不好,除此之外没有任何information。而这更像人类现实生活中的学习过程,必须自己像哪里做得好做得不够好,怎么修正。
Learning Map:
scenario:学习情景,不受自己控制。意思是你现在有什么类型的 training data。
machine learning | scenario |
---|---|
Supervised Learning | 有标签data |
Semi-supervised Learning | 部分有标签data |
Unsupervised Learning | 无标签data |
Transfer Learning | 一堆不相干data |
Reinforcement Learning | 只有来自外界的评价 |
task,意思是现在function的output是什么,只体现在supervised中,但其实可以插在以上五种Learning的每一种内。
machine learning | task(output) |
---|---|
Regression | scalar |
Classification | class1、class2…之一 |
Structured Learning | 有结构的内容 |
Method方法模型,比如在Classification中有Linear模型 or Non-linear模型,我们可以将绿色部分插入任何红色部分中。