前言 xgboost是一種集成學(xué)習(xí)算法,通過回歸樹,每一次對殘差(實際值與預(yù)測值之差)進行擬合,最后把預(yù)測值相加得到最終的預(yù)測值。比如一個小男孩...
r: 必須打開一個存在的文件,且只能進行讀操作 r+:和r一樣,必須打開一個已有的文件。最開始光標在文件前面。如果先讀,讀完后光標在文件末尾,...
本文主要摘自官方文檔 1.可以指定多個網(wǎng)址。如果是規(guī)律的。例如: http://example.com/page/1 http://exampl...
本文內(nèi)容主要摘自python machine learning 2nd edition 1、假設(shè)我們有以下三個文本 ? 'The sun is...
今天想梳理一下kaggles上面的項目,對于一些感興趣的,以后再仔細研究下 1、https://www.kaggle.com/c/titanic...
-----程序員遇到問題,或者想學(xué)習(xí)什么,第一個念頭可能都是百度/谷歌。然而作為全球最大的代碼托管平臺,github上面有著海量的代碼以及教程,...
------樸素貝葉斯是一個基于概率的多分類算法 舉個例子,周六了,群主加班的概率是0.3,爬山的概率是0.2,和wanxian約會的概率是0....
一、基本概念 1.cart使用基尼系數(shù)作為劃分標準?;嵯禂?shù)越小,則不純度越低,區(qū)分的越徹底。 2.假設(shè)有k個類別,第k個類別的概率為,則基尼系...
一、EDA ------explore data analysis,顧名思義,數(shù)據(jù)探索性分析。主要目的是對數(shù)據(jù)有個大體的認識 1、看下整體數(shù)據(jù)信...