西瓜書學習記錄 I

機器學習的根本任務(wù)是預測

machine learning
≈ looking for function

機器學習與人工智能、深度學習的關(guān)系

  • 人工智能:機器展現(xiàn)的人類智能
  • 機器學習:計算機利用已有的數(shù)據(jù)(經(jīng)驗),得出了某種模型,并利用此模型預測未來的一種方法。
  • 深度學習:實現(xiàn)機器學習的一種技術(shù)

機器學習可以解決什么問題

  • 給定數(shù)據(jù)的預測問題
    ? 數(shù)據(jù)清洗/特征選擇
    ? 確定算法模型/參數(shù)優(yōu)化
    ? 結(jié)果預測
  • 不能解決什么
    ? 大數(shù)據(jù)存儲/并行計算
    ? 做一個機器人

評價指標

樣本數(shù)除以所有的樣本數(shù),通常來說,正確率越高,分類器越好;

  • 1)正確率(accuracy):正確率是我們最常見的評價指標,accuracy = (TP+TN)/(P+N),這個很容易理解,就是被分對的
  • 2)錯誤率(error rate):錯誤率則與正確率相反,描述被分類器錯分的比例,error rate = (FP+FN)/(P+N),對某一個實例來說,分對與分錯是互斥事件,所以accuracy =1 - error rate;
  • 3)靈敏度(sensitive):sensitive = TP/P,表示的是所有正例中被分對的比例,衡量了分類器對正例的識別能力;
  • 4)特效度(specificity):specificity = TN/N,表示的是所有負例中被分對的比例,衡量了分類器對負例的識別能力;
  • 5)精度(precision):精度是精確性的度量,表示被分為正例的示例中實際為正例的比例,precision=TP/(TP+FP);
  • 6)召回率(recall):召回率是覆蓋面的度量,度量有多個正例被分為正例,recall=TP/(TP+FN)=TP/P=sensitive,可以看到召回率與靈敏度是一樣的。
  • 7)F1-score 就是一個綜合考慮precision和recall的metric: 2precisionrecall / (precision + recall)

誤差分析及過擬合/欠擬合

欠擬合的處理主要有哪些方式:

  • 添加新特征
  • 增加模型復雜度
  • 添加多項式特征項
  • 減小正則化系數(shù)

處理過擬合?

  • 增大訓練數(shù)據(jù)的量
  • 利用正則化技術(shù)
  • 對數(shù)據(jù)進行清洗
  • 減少迭代次數(shù)
  • 增大學習率

Machine Learning Summary

Rather than giving the program the rules,an algorithm finds theryles for us.

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容