Kaggle Blog里的新知

Diabetic Retinopathy

  1. 處理彩色圖像時(shí),對(duì)所有點(diǎn)減去局部平均色,降低光照的影響

Kaggle做了一個(gè)Scripts板塊,可以不用搭建本地環(huán)境也不用下載數(shù)據(jù),就可以寫代碼Run模型,目前提供三種語言R/RMarkdown/Python。Kaggle Scripts

今日頭條的公司叫字節(jié)跳動(dòng),Bytedance。

XGBoost再三出現(xiàn)在Kaggle的獲獎(jiǎng)?wù)咴L談中。

TF-IDF,一下來自百度百科:TFIDF的主要思想是:如果某個(gè)詞或短語在一篇文章中出現(xiàn)的頻率TF高,并且在其他文章中很少出現(xiàn),則認(rèn)為此詞或者短語具有很好的類別區(qū)分能力,適合用來分類。

Feature Engineering似乎很重要。

一些想法

Data Science很深,是整個(gè)industry的挺細(xì)的一個(gè)部分。我覺得我的興趣不在做深,而是什么都玩一點(diǎn),感受人類發(fā)展的前沿或者次前沿,這樣當(dāng)未來降臨時(shí)我已經(jīng)準(zhǔn)備好了。

在一段時(shí)間內(nèi)不要自己去寫算法,多了解和使用已有的包。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容