
混淆矩陣(Confusion Matrix),也叫誤差矩陣,是分類模型中常見的概念,在風控領域,我們常用「準確率」、「覆蓋率」來衡量策略和模型的...
最近半年一直在嘗試從復雜的關系網絡中,挖掘可能從事某種惡意的團伙,比如在交易數據中挖掘潛在可疑交易的詐騙團伙等。在對全網的復雜網絡分團后,面臨一...
目標管理是管理學的一個概念,即很多企業強調的“目標導向”和“結果導向”,高層制定戰略目標,中層制定中級目標,基層制定初級目標,執行層給出執行方案...
IV值(Information Value),即信息價值指標,是評分卡模型中的一個常見指標,在金融風控領域得到了廣泛的應用,尤其是在特征選擇的場...
鳶【音:yuān】尾花(Iris)是單子葉百合目花卉,是一種比較常見的花,可能不經意間你就能在某個公園里碰見它,而且鳶尾花的品種較多。如果逛公園...
決策樹是一種非參數的監督學習方法,可用于分類和回歸的應用中。旨在通過數據學習出簡單的決策規則來創建模型,進而預測和判定目標變量的結果。 ** 決...
在學習決策樹的時候,我們知道,其一大特點是:尋找最佳的決策樹是NP完成問題。什么是NP完全問題,決策樹的這一特點又是什么意思? 什么是NP完全問...
上圖是IBM Watson的首席技術專家Swami Chandrasekaran編撰的數據科學家地鐵圖,可以說是數據科學家的技能修煉指南,分享出...
過年回家,免不了會被親人問起,你是做什么的?作為一個數據技術從業者,面對沒怎么接觸過電腦,對電腦使用都不太熟悉的親人,每次回答:程序員,軟件工程...