39
14
87
9092
84
8
今天主要就是看論文,大部分時間用來處理要交的一些文件的事情了,還有聯(lián)系比較中意的工作單位。
今天收拾東西,準備返校,暫無進度。
今天卸貨和整理收拾花草,回來太晚,沒有進度。
今天去鄭州進貨了,時間較長,沒有學習進度。
今天主要是查了下相關資料,群組中的很多群友也提供了一些相對有用又具有一定價值的電子資源,暫時在看《DeepLearning》,對很多常用的模型有了更進一步的了解,理論知識有所...
今天看的是關聯(lián)規(guī)則。主要看的是Apriori算法,通過支持度,置信度,以及提升度等屬性,最終生成頻繁項集,以此組建FP樹存儲頻繁項集,遍歷數(shù)據(jù)集,對頻繁項集進行挖掘。
今天去南陽探親戚,沒有學習進度。
今天看的是EM聚類最大期望算法。通過初始化參數(shù),生成預期結(jié)果,并對其進行重新估計,再利用不同的混合模型進行聚類操作,其好處是通過不斷的操作,可以生成最接近實際的聚類結(jié)果,類似...
今天去舅舅廠里幫了一天忙,沒有學習進度。
今天看的是K-Means聚類問題。通過確定K類的中心點Means,最終實現(xiàn)聚類。用Sklearn.cluster庫的DBSCAN,Mean-Shift等方法,K-Means不...
今天看的是KNN算法。利用一種屬性來對所需處理的數(shù)據(jù)進行分類,采用距離K值作為區(qū)分的標準,由元數(shù)據(jù)的交叉驗證來完成來算出K值,最后通過多個種類的屬性,來完成所要處理的大量數(shù)據(jù)...
最近這兩天還在外面跑,只能在路上看課題相關的他人論文,以及相關技術書籍等資料,沒有實際操作。
今天看的是關于文檔識別和分類的處理案例。利用多項式貝葉斯公式計算TF-IDF值,以此計算出文檔中的詞頻,文檔頻率等數(shù)據(jù)屬性,TFIDFVectorizer類用于進行整理,NT...
今天去鄭州進貨了,回來較晚,沒有進度。
今天看的是樸素貝葉斯算法,利用先驗概率,后驗概率,條件概率,似然函數(shù)等方式進行模擬計算,每個輸入變量都是獨立的,呈離散分布,但是又能產(chǎn)生相互聯(lián)系,利用Python內(nèi)的樸素貝葉...
今天又去探外地親戚了,沒有學習進度。
今天參考教程的泰坦尼克生存預測樣例來運用決策樹。利用分類器的特征選擇對乘客的Pclass,Sex,等字段進行處理,放置到Feature特征向量中,然后通過決策樹進行模型評估預...
今天看的是Sklearn工具進行數(shù)據(jù)挖掘算法的運行。Sklearn自身含有決策樹分類器DecisionTreeClassifer,在criterion設定分類,比如此前的ID...
今天花店開業(yè)去鄭州進貨,回來太晚,沒有學習。
今天看的是分類樹,CART算法的決策樹可以作為分類樹或者回歸樹,通過尋找純凈的劃分,引出純度。而CART算法主干和C4.5較為類似,但是核心是使用基尼系數(shù),來判斷各樣本數(shù)據(jù)之...