混淆矩陣(Confusion Matrix),也叫誤差矩陣,是分類模型中常見的概念,在風(fēng)控領(lǐng)域,我們常用「準(zhǔn)確率」、「覆蓋率」來(lái)衡量策略和模型的...
最近半年一直在嘗試從復(fù)雜的關(guān)系網(wǎng)絡(luò)中,挖掘可能從事某種惡意的團(tuán)伙,比如在交易數(shù)據(jù)中挖掘潛在可疑交易的詐騙團(tuán)伙等。在對(duì)全網(wǎng)的復(fù)雜網(wǎng)絡(luò)分團(tuán)后,面臨一...
目標(biāo)管理是管理學(xué)的一個(gè)概念,即很多企業(yè)強(qiáng)調(diào)的“目標(biāo)導(dǎo)向”和“結(jié)果導(dǎo)向”,高層制定戰(zhàn)略目標(biāo),中層制定中級(jí)目標(biāo),基層制定初級(jí)目標(biāo),執(zhí)行層給出執(zhí)行方案...
IV值(Information Value),即信息價(jià)值指標(biāo),是評(píng)分卡模型中的一個(gè)常見指標(biāo),在金融風(fēng)控領(lǐng)域得到了廣泛的應(yīng)用,尤其是在特征選擇的場(chǎng)...
鳶【音:yuān】尾花(Iris)是單子葉百合目花卉,是一種比較常見的花,可能不經(jīng)意間你就能在某個(gè)公園里碰見它,而且鳶尾花的品種較多。如果逛公園...
決策樹是一種非參數(shù)的監(jiān)督學(xué)習(xí)方法,可用于分類和回歸的應(yīng)用中。旨在通過(guò)數(shù)據(jù)學(xué)習(xí)出簡(jiǎn)單的決策規(guī)則來(lái)創(chuàng)建模型,進(jìn)而預(yù)測(cè)和判定目標(biāo)變量的結(jié)果。 ** 決...
在學(xué)習(xí)決策樹的時(shí)候,我們知道,其一大特點(diǎn)是:尋找最佳的決策樹是NP完成問題。什么是NP完全問題,決策樹的這一特點(diǎn)又是什么意思? 什么是NP完全問...
上圖是IBM Watson的首席技術(shù)專家Swami Chandrasekaran編撰的數(shù)據(jù)科學(xué)家地鐵圖,可以說(shuō)是數(shù)據(jù)科學(xué)家的技能修煉指南,分享出...
過(guò)年回家,免不了會(huì)被親人問起,你是做什么的?作為一個(gè)數(shù)據(jù)技術(shù)從業(yè)者,面對(duì)沒怎么接觸過(guò)電腦,對(duì)電腦使用都不太熟悉的親人,每次回答:程序員,軟件工程...