Stanford-CS-229-CN.Video1&2

參考內(nèi)容:
斯坦福大學(xué)公開課 :機器學(xué)習(xí)課程
Stanford-CS-229-CN

Video 1 機器學(xué)習(xí)的動機與應(yīng)用

一、Supervised Learning

1. Regression problems

如房價預(yù)測

2. Classification problems

如腫瘤是否良性

二、Learning Theory

三、Unsupervised Learning

如分隔兩個聲源的聲音

四、Reinforcement Learning(強化學(xué)習(xí))

1. reward function

如控制飛機自動飛行,bad dog & good dog example

Video 2 監(jiān)督學(xué)習(xí)應(yīng)用.梯度下降

一、Supervised Learning

1. Regression problem:

自動駕駛:人類司機教算法學(xué)習(xí)駕駛
房價預(yù)測:

  • m = # training examples
  • x = "input" variables/features
  • y = "output" variables/ "target" variables
  • (x, y) = training example
  • ith training example = (x(i), y(i))

假設(shè)h(x) = θ<sub>0</sub>+θ<sub>1</sub>x

假設(shè)X1 = Size,X2 = # the rooms,
h(x) = hθ(x) = θ0 + θ1x1 + θ2x2

gradient descent - 存在局部最優(yōu)解問題
batch gradient descent
  • 隨機梯度下降 stochastic gradient descent (incremental DG) 在有大規(guī)模數(shù)據(jù)集時下降更快,在最小值附近徘徊。


    SGD
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

推薦閱讀更多精彩內(nèi)容