sklearn介紹
sklearn,全稱scikit-learn,是一個(gè)開源的基于python語言的機(jī)器學(xué)習(xí)工具包。它通過numpy、scipy、matplotlib、pandas等python庫實(shí)現(xiàn)高效的算法應(yīng)用,涵蓋了幾乎所有主流機(jī)器學(xué)習(xí)算法。
在工程中,用python的基礎(chǔ)庫來搭建機(jī)器學(xué)習(xí)算法非常低效(但還是推薦在學(xué)習(xí)階段使用基礎(chǔ)庫去搭建機(jī)器學(xué)習(xí)算法,可以進(jìn)一步深入算法),且還容易出錯(cuò),而在機(jī)器學(xué)習(xí)中經(jīng)常大部分時(shí)間(70%)是在對(duì)數(shù)據(jù)進(jìn)行處理,構(gòu)建合格的數(shù)據(jù)集,只有少部分時(shí)間在構(gòu)建模型代碼,直接調(diào)用成熟算法工具包,可以在實(shí)現(xiàn)工程應(yīng)用效率和效果之間找到一個(gè)平衡,這也正是sklearn帶給我們的優(yōu)勢(shì)。
sklearn有一個(gè)完整而豐富的官網(wǎng),里面詳細(xì)講解了skLearn實(shí)現(xiàn)的算法數(shù)學(xué)原理、優(yōu)化方式和簡(jiǎn)單應(yīng)用,是一套非常優(yōu)秀的文檔,我相信在學(xué)習(xí)階段仔細(xì)查閱官網(wǎng)文檔會(huì)收獲頗豐!!
下面我提供sklearn的官方文檔鏈接,由于原文是英文的,我還提供了第三方的中文文檔。