為了方便復(fù)習(xí)面經(jīng),根據(jù)筆者的復(fù)習(xí)進(jìn)度,持續(xù)更新匯總一些覺得比較有價(jià)值的文章鏈接。希望能夠一起學(xué)習(xí)~ ※代表被問過
機(jī)器學(xué)習(xí)
-
kmeans原理、k值選擇、初始點(diǎn)選擇 ※
(1)初始點(diǎn)選擇- 選擇批次距離盡可能遠(yuǎn)的K個(gè)點(diǎn)
首先隨機(jī)選擇一個(gè)點(diǎn)作為第一個(gè)初始類簇中心點(diǎn),然后選擇距離該點(diǎn)最遠(yuǎn)的那個(gè)點(diǎn)作為第二個(gè)初始類簇中心點(diǎn),然后再選擇距離前兩個(gè)點(diǎn)的最近距離最大的點(diǎn)作為第三個(gè)初始類簇的中心點(diǎn),以此類推,直至選出K個(gè)初始類簇中心點(diǎn)。 - 選用層次聚類或者Canopy算法進(jìn)行初始聚類,然后利用這些類簇的中心點(diǎn)作為KMeans算法初始類簇中心點(diǎn)
(2)K值選擇
- 按實(shí)際情況選擇、手肘法、間隔統(tǒng)計(jì)量、輪廓系數(shù)、canopy法
https://www.biaodianfu.com/k-means-choose-k.html
- 選擇批次距離盡可能遠(yuǎn)的K個(gè)點(diǎn)
kmeans 與 DBSCAN 區(qū)別
https://www.cnblogs.com/hugechuanqi/p/10509307.html
(3) kmeans 是假設(shè)數(shù)據(jù)服從什么分布?※
數(shù)據(jù)類別不平衡處理 ※
https://zhuanlan.zhihu.com/p/32940093優(yōu)化方法 SGD,Momentum,AdaGrad,RMSProp,Adam ※
https://blog.csdn.net/u010089444/article/details/76725843L1不可導(dǎo)的時(shí)候該怎么辦 ※
近端梯度法、坐標(biāo)下降法PCA數(shù)學(xué)原理(強(qiáng)烈推薦)
http://blog.codinglabs.org/articles/pca-tutorial.html召回率和查全率等指標(biāo)
https://zhuanlan.zhihu.com/p/56109450SVM相關(guān)問題 ※
https://blog.csdn.net/szlcw1/article/details/52259668
https://blog.csdn.net/cppjava_/article/details/68060439L1和L2區(qū)別 ※
https://blog.csdn.net/jinping_shi/article/details/52433975常見的機(jī)器學(xué)習(xí)模型
https://www.nowcoder.com/ta/review-ml/review?query=&asc=true&order=&page=66Loss Function 有哪些?如何用?
https://www.nowcoder.com/questionTerminal/508661036afd4df298e3887cbb14c68d為什么LR模型損失函數(shù)使用交叉熵不用均方差?
https://blog.csdn.net/dpengwang/article/details/96597606-
集成學(xué)習(xí) ※
bagging 與boosting 區(qū)別
https://zhuanlan.zhihu.com/p/31618506Adaboost 與 GDBT 與 XGB 區(qū)別聯(lián)系
https://zhuanlan.zhihu.com/p/42740654樹模型理解(非常全)
ID3、C4.5、CART
https://zhuanlan.zhihu.com/p/85731206
Random Forest、Adaboost、GBDT
https://zhuanlan.zhihu.com/p/86263786
XGBoost、LightGBM
https://zhuanlan.zhihu.com/p/87885678
深度學(xué)習(xí)
- tensorflow、keras原理與區(qū)別
- dropout原理 ※
https://zhuanlan.zhihu.com/p/38200980 - 人臉識(shí)別指標(biāo)FAR與FRR定義(可和前面的召回率、查全率相對(duì)比)
https://blog.csdn.net/zc199329/article/details/83857695 - resnet結(jié)構(gòu)理解 ※
https://zhuanlan.zhihu.com/p/54289848 - CNN的原理?(筆者面阿里淘系算法崗一面的問題之一)※
http://www.itdecent.cn/p/27e508c18146
添加一個(gè)關(guān)于VGG的理解文章鏈接,里面關(guān)于卷積核的大小的選擇也是面試點(diǎn)之一(騰訊ieg提前批一面)
http://www.itdecent.cn/p/68ac04943f9e