HDFS HDFS概述 HDFS(Hadoop Distributed File System)是 Hadoop 項(xiàng)目的一個(gè)子項(xiàng)目。是 Hadoop 的核心組件之一, ...
jdk,hadoop,hive安裝知乎,順序非常的重要 https://zhuanlan.zhihu.com/p/508841769[https://zhuanlan.zhi...
項(xiàng)目背景:根據(jù)寶馬客戶要求,準(zhǔn)確評估電池壽命質(zhì)保年限 主要工作: 項(xiàng)目理解:查找電池壽命預(yù)測相關(guān)資料,理解業(yè)務(wù)需求,根據(jù)現(xiàn)有的硬件選擇合適的算法 數(shù)據(jù)預(yù)處理:數(shù)據(jù)探索,異常值...
問題 實(shí)際處理和解決機(jī)器學(xué)習(xí)問題過程中,我們會遇到一些“大數(shù)據(jù)”問題,比如有上百萬條數(shù)據(jù),上千上萬維特征,此時(shí)數(shù)據(jù)存儲已經(jīng)達(dá)到10G這種級別。這種情況下,如果還是直接使用傳統(tǒng)...
激活函數(shù)的作用是什么? 激活函數(shù)的作用是:引入非線性因素,提高了模型的表達(dá)能力。如果沒有激活函數(shù),那么模型就只有線性變換,可想而知線性模型能表達(dá)的空間是有限的。而激活函數(shù)引入...
優(yōu)點(diǎn):泛化錯(cuò)誤率低,易編碼,可以應(yīng)用在大部分分類器上,無參數(shù)調(diào)整。缺點(diǎn):對離群點(diǎn)敏感。適用數(shù)據(jù)類型:數(shù)值型和標(biāo)稱型數(shù)據(jù)。 (1) 收集數(shù)據(jù):可以使用任意方法。(2) 準(zhǔn)備數(shù)據(jù)...
(1) 收集數(shù)據(jù):采用任意方法收集數(shù)據(jù)。(2) 準(zhǔn)備數(shù)據(jù):回歸需要數(shù)值型數(shù)據(jù),標(biāo)稱型數(shù)據(jù)將被轉(zhuǎn)成二值型數(shù)據(jù)。(3) 分析數(shù)據(jù):繪出數(shù)據(jù)的可視化二維圖將有助于對數(shù)據(jù)做出理解和分...
簡單介紹一下RNN、LSTM、GRU?他們的區(qū)別和聯(lián)系是什么? RNN即Recurrent Neural Networks、循環(huán)神經(jīng)網(wǎng)絡(luò),本質(zhì)是一個(gè)全連接網(wǎng)絡(luò),但是因?yàn)楫?dāng)前時(shí)...
(1) 收集數(shù)據(jù):采用任意方法收集數(shù)據(jù)。(2) 準(zhǔn)備數(shù)據(jù):由于需要進(jìn)行距離計(jì)算,因此要求數(shù)據(jù)類型為數(shù)值型。另外,結(jié)構(gòu)化數(shù)據(jù)格式則最佳。(3) 分析數(shù)據(jù):采用任意方法對數(shù)據(jù)進(jìn)行...
原理解析的非常清楚[https://www.pkudodo.com/2018/11/18/1-4/][https://www.pkudodo.com/2018/11/18/1...
優(yōu)點(diǎn):在數(shù)據(jù)較少的情況下仍然有效,可以處理多類別問題。缺點(diǎn):對于輸入數(shù)據(jù)的準(zhǔn)備方式較為敏感。適用數(shù)據(jù)類型:標(biāo)稱型數(shù)據(jù)(也就是只有兩類結(jié)果的數(shù)據(jù))。 (1) 收集數(shù)據(jù):可以使用...
(1) 收集數(shù)據(jù):可以使用任何方法。(2) 準(zhǔn)備數(shù)據(jù):樹構(gòu)造算法只適用于標(biāo)稱型數(shù)據(jù),因此數(shù)值型數(shù)據(jù)必須離散化。(離散跟隨記)(3) 分析數(shù)據(jù):可以使用任何方法,構(gòu)造樹完成之后...
手撕KNN算法 對未知類別屬性的數(shù)據(jù)集中的每個(gè)點(diǎn)依次執(zhí)行以下操作:(1) 計(jì)算已知類別數(shù)據(jù)集中的點(diǎn)與當(dāng)前點(diǎn)之間的距離;(2) 按照距離遞增次序排序;(3) 選取與當(dāng)前點(diǎn)距離最...
第二章 K-近鄰算法(代碼) K-近鄰算法優(yōu)缺點(diǎn)-. 優(yōu)點(diǎn):精度高,對異常值步敏感,無數(shù)據(jù)輸入假定。缺點(diǎn):計(jì)算復(fù)雜度高,空間復(fù)雜度高。范圍:數(shù)值型和標(biāo)稱型。 測試分類器錯(cuò)誤率...
在前兩周的課堂抽簽中,我們小組抽到了熟悉的波普藝術(shù),我們也通過一周的收集和整理,完成了波普藝術(shù)的ppt并在今天完成了演講,所以在聽取了別的小組同學(xué)的建議和想法后,在此做一個(gè)簡...
1. 集成算法 1.1 集成算法是通過在數(shù)據(jù)上構(gòu)建多個(gè)模型,集成所有模型的建模結(jié)果,包括隨機(jī)森林,梯度提升樹(GBDT),Xgboost等。1.2 多個(gè)模型集成成為的模型叫做...