
停更應該有一年多了,上次發文章還是2021年3月,現在已經快2022年5月了。時間過的真的好快。 疫情也還沒結束,又變得嚴重了,現在人在上海,已...
visual bert VisualBert 融合了bert 的目標檢測系統如fast-rcnn,并且可以用于一系列的視覺和語言任務。 作者提出...
當一個模型中有成千上萬的特征時,這時候應該如何做特征選擇呢? 1.盡量使用LR而非XGB 高維稀疏特征lr 的效果會比 gbdt 好每次都根據當...
轉眼就到了2021年了,時間過的好快,2020年過的很快,不知道怎的,一年就過去了,忙東忙西的。也好久沒更新了,還有3天就要開始上班了,??,只能...
Random sample consensus 核心思想:把數據分成inliers 和outliers,選用inliers的數據訓練模型。是一種...
CRISP-DM (cross-industry standard process for data mining), 即為"跨行業數據挖掘標準...
MITIE 實現底層算法和原理: MITIE在chatbot 框架rasa中被廣泛應用,但是rasa和原始的mitie均沒有介紹mitie的底層...
在python 有有個神奇的東西,什么樣的值可以直接用True 和False 來判斷,在if語句中和直接判斷有什么區別。 可以看到,直接用2 i...
NLP subword: 1.傳統方法 空格token 傳統詞表示方法無法很好的處理未知或罕見的詞匯(OOV問題) 傳統詞tokenizatio...