softmax這個結果就可以描述為每個類的概率
softmax這個結果可以描述為每個類的概率
故,不會造成學習慢!是根據信息熵的概念進行求解。
Overfitting
例如我們利用1000個數據作為訓練,表現出的情況:
Cost表現看起來還不錯,Test的變化如下:
當然了還有其他的方式來客服Overfitting
實驗證明一下:
softmax這個結果可以描述為每個類的概率
故,不會造成學習慢!是根據信息熵的概念進行求解。
Overfitting
例如我們利用1000個數據作為訓練,表現出的情況:
Cost表現看起來還不錯,Test的變化如下:
當然了還有其他的方式來客服Overfitting
實驗證明一下: