超平面的相關知識是學習SVM算法的數(shù)學基礎。當初為了弄清楚超平面的全面知識,在網(wǎng)絡上搜尋良久都沒找到詳細的講解,最終是一篇英文講義救了急。我做了中文筆記分享出來,希望能幫助到...
超平面的相關知識是學習SVM算法的數(shù)學基礎。當初為了弄清楚超平面的全面知識,在網(wǎng)絡上搜尋良久都沒找到詳細的講解,最終是一篇英文講義救了急。我做了中文筆記分享出來,希望能幫助到...
決策樹算法利用非度量(nunmetric)的方式進行一系列的查詢問答來判斷和分類,被廣泛用于分類和回歸模型,三種最常用的實現(xiàn)算法是CART、ID3、C4.5。對于同一個數(shù)據(jù)集...
邏輯回歸(logistic regression)被廣泛用于分類預測,例如:銀行通過客戶的用戶行為判斷客戶是否會流失,醫(yī)院通過病人腫瘤的形態(tài)特征判斷腫瘤是否為良性,電子郵箱通...
Hive的數(shù)學函數(shù)包含兩種,一種是內(nèi)嵌函數(shù),一種是由java定義的自定義函數(shù)。對于不懂Java的數(shù)據(jù)分析師,掌握Hive的內(nèi)嵌函數(shù)就顯得尤為重要啦~ Hive內(nèi)嵌函數(shù)都有哪些...
hive是什么呢?如果用它的百度概念,那就是:hive是基于Hadoop的一個數(shù)據(jù)倉庫工具,可以將結(jié)構(gòu)化的數(shù)據(jù)文件映射為一張數(shù)據(jù)庫表,并提供完整的sql查詢功能,可以將sql...
1.通配符的分類: 1.星號(*):表示任意多個字符(可以為0個)2.問號(?):表示任意一個字符(必須為1個)3.井號(#):表示任意一個數(shù)字(必須為1個)4.感嘆號(!)...
對于存在excel里的數(shù)據(jù)諸如商品信息、會員信息、交易信息等,每當我們需要查找的時候,第一反應都是使用Ctrl+F或vlookup函數(shù),但如果表格和信息行數(shù)較多,這樣的查找就...
嘿嘿嘿,我覺得VBA最好玩的一點是:它非常接地氣!VBA是什么?就是用敲代碼的方式使用EXCEL唄,一切報表用上VBA,簡直分分鐘搞定呀!本篇想要分享的是我們工作中經(jīng)常會用到...
作為一個最近正在學習 SQL 的大白(●—●),只想說一句:語法一看就懂,一睡就廢!白天好不容易把《SQLxxx》視頻看懂,兩眼一閉,第二天就記住了‘select xxx’。...
Tableau作為市面上最流行的可視化BI工具,功能非常強大,可以產(chǎn)出多種直觀反映數(shù)據(jù)的圖表。本人在學習過程中,發(fā)現(xiàn)除了經(jīng)常使用的條形圖、直方圖、箱型圖等,有一些特定圖表在展...
前言 本文將介紹如何使用Plotly+Cufflinks更簡便地制作出更好的圖表。這是Github上一個大神發(fā)布的資料,本人學習之后覺得非常實用,所以和大家分享。需要查看代碼...
寫在前面的話 開始做數(shù)據(jù)分析,最頭疼的就是數(shù)據(jù)探索和清洗了。Pandas里面有很多函數(shù)用于初步探索和分析,例如pd.describe()。今天逛著逛著,發(fā)現(xiàn)了一個數(shù)據(jù)庫,能夠...
寫在前面的話 plotly是一個基于JavaScript的繪圖庫,可以繪制精致的動態(tài)交互圖形,繪圖結(jié)果默認保存成html文件,可以通過瀏覽器查看。plotly不能直接接受nu...
寫在前面的話 Pandas是專門做數(shù)據(jù)處理和分析的,擁有許多各種復雜的函數(shù)。Pandas功能強大,支持類似于SQL的數(shù)據(jù)處理。Pandas的底層依賴于Numpy,是在Nump...