0x00 內(nèi)容 學(xué)習(xí)內(nèi)容:無監(jiān)督聚類算法K-Means k-means:模型原理、收斂過程、超參數(shù)的選擇 0x01聚類 聚類分析是在數(shù)據(jù)中發(fā)現(xiàn)數(shù)據(jù)對(duì)象之間的關(guān)系,將數(shù)據(jù)進(jìn)行分...
0x00 內(nèi)容 學(xué)習(xí)內(nèi)容:無監(jiān)督聚類算法K-Means k-means:模型原理、收斂過程、超參數(shù)的選擇 0x01聚類 聚類分析是在數(shù)據(jù)中發(fā)現(xiàn)數(shù)據(jù)對(duì)象之間的關(guān)系,將數(shù)據(jù)進(jìn)行分...
0x00 內(nèi)容 如何提升數(shù)據(jù)可視化的表現(xiàn)效果 主要探討一下,哪些方面的改進(jìn)和有益實(shí)踐,可以使我們的數(shù)據(jù)可視化的呈現(xiàn)效果更加具有表現(xiàn)力。 目標(biāo)有兩個(gè): 了解哪些方面的因素,會(huì)對(duì)...
0x00 內(nèi)容 決策樹:決策樹、信息熵、基尼系數(shù)、CART 實(shí)踐:代碼實(shí)現(xiàn)決策樹 0x01 決策樹 決策樹的建模思路是盡可能模擬人做決策的過程。幾乎沒有任何抽象,完全通過生成...
0x00 內(nèi)容 邏輯回歸:損失函數(shù)、梯度、決策邊界 實(shí)踐:代碼實(shí)現(xiàn)及sklearn邏輯回歸 0x01 邏輯回歸 邏輯回歸(Logistic Regression,LR),LR...
0x00 目標(biāo) 對(duì)比可視化中最常用的幾種圖表,區(qū)分它們的異同點(diǎn)及其適用的場景。 0x01 常用圖表對(duì)比 以例子「可視化目標(biāo)→數(shù)據(jù)集準(zhǔn)備→圖表選擇和對(duì)比→經(jīng)驗(yàn)總結(jié)」的方式做對(duì)比...
0x00 內(nèi)容 梯度下降:實(shí)現(xiàn)梯度下降、線性回歸中的梯度下降 隨機(jī)梯度下降:相關(guān)代碼即調(diào)用 0x01梯度下降法(回顧四:0x04梯度下降法) 最小二乘法求損失函數(shù)的最小值,但...
0x00 內(nèi)容 區(qū)間型數(shù)據(jù):了解區(qū)間型數(shù)據(jù)的特點(diǎn),熟練使用「條形進(jìn)度圖、儀表盤、環(huán)形進(jìn)度圖」表示數(shù)據(jù)的進(jìn)度和定量指標(biāo)的定性化; 關(guān)系型數(shù)據(jù):了解數(shù)據(jù)之間常見的關(guān)系類型,能熟練...
0x00 目標(biāo) 簡單線性回歸:回顧簡單線性回歸及最小二乘法的數(shù)據(jù)推導(dǎo) 實(shí)踐:簡單線性回歸實(shí)現(xiàn)及向量化應(yīng)用 多元線性回歸:多選線性回歸和正規(guī)方程解及實(shí)現(xiàn) 0x01 簡單線性回歸...
0x00 可視化圖表選擇 兩類不同的可視化目的及其可選擇的圖表形式。 「對(duì)比型數(shù)據(jù)」:對(duì)比兩組或兩組以上數(shù)據(jù)的差異。 「分布型數(shù)據(jù)」:研究數(shù)據(jù)分布的集中趨勢、離散程度、偏態(tài)和...
0x00 可視化圖表選擇 0x01 時(shí)序數(shù)據(jù)可視化 時(shí)序數(shù)據(jù),是指任何隨著時(shí)間而變化的數(shù)據(jù)。 要進(jìn)行時(shí)序數(shù)據(jù)的可視化,我們首先需要了解「時(shí)間」所具有的特征: 有序性:時(shí)間都是...
0x00 可視化 數(shù)據(jù)可視化不是簡單的視覺映射,而是一個(gè)以數(shù)據(jù)流向?yàn)橹骶€的一個(gè)完整流程,主要包括:數(shù)據(jù)采集、數(shù)據(jù)處理和變換、可視化映射、用戶交互和用戶感知。一個(gè)完整的可視化過...
0x00 目標(biāo) 學(xué)習(xí)目標(biāo)有四個(gè): 無量綱化:最值歸一化、均值方差歸一化及sklearn中的Scaler; 缺失值處理; 處理分類型特征:編碼與啞變量; 處理連續(xù)型特征:二值化...
0x00評(píng)價(jià)模型的好壞 1.數(shù)據(jù)拆分:訓(xùn)練數(shù)據(jù)集&測試數(shù)據(jù)集 2.評(píng)價(jià)分類結(jié)果:精準(zhǔn)度、混淆矩陣、精準(zhǔn)率、召回率、F1 Score、ROC曲線等 3.評(píng)價(jià)回歸結(jié)果:MSE、R...
0x00kNN思想 kNN(k-NearestNeighbor),也就是k最近鄰算法。顧名思義,所謂K最近鄰,就是k個(gè)最近的鄰居的意思。也就是在數(shù)據(jù)集中,認(rèn)為每個(gè)樣本可以用離...