
作者:JSong,日期:2017.10.10 簡書一直不肯支持數學公式,沒辦法,只能截圖啦。原文請移步博客園 集成學習(ensemble lea...
作者:JSong,時間:2017.10.21 廣義的偏差(bias)描述的是預測值和真實值之間的差異,方差(variance)描述距的是預測值作...
待整理 假設文檔是由n個詞組成的,且不考慮詞之間的關系,假設我們的詞典有V個詞語,v1,v2,...vv,那么最簡單的文本生成方法是: 每次從詞...
持續更新中 一個算法可以從很多角度去闡述,如統計學思維(最大似然、貝葉斯)、數值計算思維(最優化、正則化)、信息論思維(熵)等 1、數值計算與正...
1、Uniform分布 U(a,b) 概率密度函數 可以用線性同余生成器生成 2、二項分布 記事件A在一次實驗中發生的概率為p,把這個實驗地獨立...
待完善 1、偏差與方差 我們對學習算法的期望泛化錯誤率進行拆解,以回歸任務為例。 假設 泛化誤差可分解為偏差、方差與噪聲之和。 決策樹雖然在設計...
本文僅作網絡筆記用,不定時完善。 決策樹根據輸出的不同,分為回歸樹和分類樹,但兩種樹的學習過程并無特別大的不同,都是分為兩步: 決策樹生成 決策...
作者:jasonfreak,原文地址:使用sklearn做單機特征工程 目錄 特征工程是什么? 數據預處理2.1 無量綱化2.1.1 標準化2....
多重共線性是使用線性回歸算法時經常要面對的一個問題。在其他算法中,例如決策樹和貝葉斯,前者的建模過程是逐步遞進,每次拆分只有一個變量參與,這種建...