關(guān)聯(lián)分析 關(guān)聯(lián)分析:從大規(guī)模數(shù)據(jù)集中尋找物品見(jiàn)的隱含關(guān)系被稱作關(guān)聯(lián)分析或者關(guān)聯(lián)規(guī)則學(xué)習(xí)。存在的問(wèn)題:尋找物品的不同組合是一項(xiàng)十分耗時(shí)的任務(wù),所需要的計(jì)算代價(jià)很高,暴力搜索不能...
關(guān)聯(lián)分析 關(guān)聯(lián)分析:從大規(guī)模數(shù)據(jù)集中尋找物品見(jiàn)的隱含關(guān)系被稱作關(guān)聯(lián)分析或者關(guān)聯(lián)規(guī)則學(xué)習(xí)。存在的問(wèn)題:尋找物品的不同組合是一項(xiàng)十分耗時(shí)的任務(wù),所需要的計(jì)算代價(jià)很高,暴力搜索不能...
樸素貝葉斯 樸素貝葉斯分類算法是基于兩種假設(shè)的一種分類算法: 每一個(gè)特征同樣重要 每一個(gè)特征之間相互獨(dú)立 貝葉斯定理 證明:條件概率公式 同理 聯(lián)立可以得到 貝葉斯策略理...
協(xié)同過(guò)濾簡(jiǎn)介 協(xié)同過(guò)濾是一種基于一組興趣相同的用戶或項(xiàng)目進(jìn)行的推薦,它根據(jù)鄰居用戶(與目標(biāo)用戶興趣相似的用戶)的偏好信息產(chǎn)生對(duì)目標(biāo)用戶的推薦列表。協(xié)同過(guò)濾算法主要分為: 基于...
ROC(Receiver Operating Characteristic) 主要分析工具是一個(gè)畫(huà)在二維平面上的曲線——ROC curve。 平面的橫坐標(biāo)是 false po...
方法一: 已知 如果直接模擬做的話可以為如下的形式: 通過(guò)模擬矩陣的乘法可以發(fā)現(xiàn)會(huì)和都相乘一次,所以我們map階段可以這樣做。 將 的元素變成的形式 將 的元素變成的形式 S...
相關(guān)概念 無(wú)監(jiān)督學(xué)習(xí) 我們前面所學(xué)的邏輯回歸,線性回歸等都需要經(jīng)過(guò)的訓(xùn)練,而無(wú)監(jiān)督學(xué)習(xí)與我們前面所講的不同,無(wú)監(jiān)督學(xué)習(xí)的目的是學(xué)習(xí)出一個(gè)function f ,包括兩種: 密...
入門(mén)篇 推薦《3小時(shí)快學(xué)期權(quán)》 雖然書(shū)名有些夸大的成分,但是卻并不妨礙作為一本期權(quán)入門(mén)的好書(shū)。本書(shū)印象最深刻莫過(guò)于類比和各類的手工制圖。其中諸如樓花、糧食最低收購(gòu)價(jià)、電影票、...
過(guò)擬合現(xiàn)象 為了得到一致假設(shè)而使假設(shè)變得過(guò)度復(fù)雜稱為過(guò)擬合。想像某種學(xué)習(xí)算法產(chǎn)生了一個(gè)過(guò)擬合的分類器,這個(gè)分類器能夠百分之百的正確分類樣本數(shù)據(jù)(即再拿樣本中的文檔來(lái)給它,它絕...
歡迎討論交流~
【算法】異常檢測(cè)異常檢測(cè) 異常檢測(cè)(Anomaly Detection):異常檢測(cè)就是從數(shù)據(jù)集中檢測(cè)出異常樣本,是一種無(wú)監(jiān)督學(xué)習(xí)。 引例 飛機(jī)制造商在飛機(jī)引擎從生產(chǎn)線上流出時(shí),會(huì)考慮進(jìn)行異常...
異常檢測(cè) 異常檢測(cè)(Anomaly Detection):異常檢測(cè)就是從數(shù)據(jù)集中檢測(cè)出異常樣本,是一種無(wú)監(jiān)督學(xué)習(xí)。 引例 飛機(jī)制造商在飛機(jī)引擎從生產(chǎn)線上流出時(shí),會(huì)考慮進(jìn)行異常...
歡迎交流討論~
【投資理財(cái)】啥是期權(quán)?啥是期權(quán)? 期權(quán)(Option),是一種選擇權(quán),指是一種能在未來(lái)某特定時(shí)間以特定價(jià)格買(mǎi)入或賣(mài)出一定數(shù)量的某種特定商品的權(quán)利。它是在期貨的基礎(chǔ)上產(chǎn)生的一種金融工具,給予買(mǎi)方(或...
歡迎交流討論~
【python】 圖形化數(shù)據(jù)庫(kù)操作Linux下安裝MySQLdb 參考這里[http://blog.itpub.net/26855487/viewspace-1063395/] python 數(shù)據(jù)庫(kù)編程提供的...
歡迎交流討論~
【研發(fā)工具】Git 基本操作準(zhǔn)備工作 windows下安裝Git客戶端:傳送門(mén)[http://msysgit.github.com]下載完成之后按照指導(dǎo)一步步安裝就好了。 初始配置 設(shè)置用戶名和郵箱 這...
歡迎交流討論~
【研發(fā)工具】Hive基礎(chǔ)Hive 簡(jiǎn)介 hive是基于Hadoop的一個(gè)數(shù)據(jù)倉(cāng)庫(kù)工具,可以將結(jié)構(gòu)化的數(shù)據(jù)文件映射為一張數(shù)據(jù)庫(kù)表,并提供簡(jiǎn)單的sql查詢功能,可以將sql語(yǔ)句轉(zhuǎn)換為MapReduce任...
歡迎交流討論~
【算法】集成學(xué)習(xí):AdaBoost集成學(xué)習(xí) 集成學(xué)習(xí)通過(guò)構(gòu)建并合并多個(gè)學(xué)習(xí)器來(lái)完成學(xué)習(xí)任務(wù),有時(shí)也被稱為多分類器系統(tǒng)。如果在集成學(xué)習(xí)中我們使用的學(xué)習(xí)器只包括同種類型的個(gè)體學(xué)習(xí)器,如“決策樹(shù)集成”中全是決策樹(shù),...
歡迎交流討論~
【算法】python實(shí)現(xiàn)邏輯回歸預(yù)備資源 Python的幾個(gè)包: numpy: Python的語(yǔ)言擴(kuò)展,定義了數(shù)字的數(shù)組和矩陣 pandas: 直接處理和操作數(shù)據(jù)的主要package statsmodels...
歡迎交流討論~
【算法】決策樹(shù)基本流程 決策樹(shù)(decision tree)是一類常見(jiàn)的機(jī)器學(xué)習(xí)方法。決策樹(shù)是一個(gè)預(yù)測(cè)模型;他代表的是對(duì)象屬性與對(duì)象值之間的一種映射關(guān)系。樹(shù)中每個(gè)節(jié)點(diǎn)表示某個(gè)對(duì)象,而每個(gè)分...
基本流程 決策樹(shù)(decision tree)是一類常見(jiàn)的機(jī)器學(xué)習(xí)方法。決策樹(shù)是一個(gè)預(yù)測(cè)模型;他代表的是對(duì)象屬性與對(duì)象值之間的一種映射關(guān)系。樹(shù)中每個(gè)節(jié)點(diǎn)表示某個(gè)對(duì)象,而每個(gè)分...
預(yù)備資源 Python的幾個(gè)包: numpy: Python的語(yǔ)言擴(kuò)展,定義了數(shù)字的數(shù)組和矩陣 pandas: 直接處理和操作數(shù)據(jù)的主要package statsmodels...
集成學(xué)習(xí) 集成學(xué)習(xí)通過(guò)構(gòu)建并合并多個(gè)學(xué)習(xí)器來(lái)完成學(xué)習(xí)任務(wù),有時(shí)也被稱為多分類器系統(tǒng)。如果在集成學(xué)習(xí)中我們使用的學(xué)習(xí)器只包括同種類型的個(gè)體學(xué)習(xí)器,如“決策樹(shù)集成”中全是決策樹(shù),...