第一課 了解SQL 1.1 數(shù)據(jù)庫基礎(chǔ) ① 數(shù)據(jù)庫:保存有組織的數(shù)據(jù)的容器② 表:某種特定類型數(shù)據(jù)的結(jié)構(gòu)化清單③ 列 :表中的一個字段④ 數(shù)據(jù)類型:所允許的數(shù)據(jù)類型⑤ 行:...
第一課 了解SQL 1.1 數(shù)據(jù)庫基礎(chǔ) ① 數(shù)據(jù)庫:保存有組織的數(shù)據(jù)的容器② 表:某種特定類型數(shù)據(jù)的結(jié)構(gòu)化清單③ 列 :表中的一個字段④ 數(shù)據(jù)類型:所允許的數(shù)據(jù)類型⑤ 行:...
@caffeine_aa75 Yes
模型調(diào)參——隨機(jī)森林在乳腺癌數(shù)據(jù)集上的調(diào)參應(yīng)用一、數(shù)據(jù)集 Sklearn自帶數(shù)據(jù)集——乳腺癌數(shù)據(jù)集 二、模型選擇 乳腺癌數(shù)據(jù)集是二分類模型,選擇隨機(jī)森林模型進(jìn)行調(diào)參 三、調(diào)參流程 1)簡單建模,觀察模型在數(shù)據(jù)集上具體的表...
那....一頁一頁復(fù)制數(shù)據(jù)粘貼下來Excel,然后再進(jìn)去后面的分析吧,應(yīng)該半個小時能下載好數(shù)據(jù)源。
Excel數(shù)據(jù)分析——藥智網(wǎng)全國醫(yī)院數(shù)據(jù)相關(guān)分析一、藥智網(wǎng)介紹 藥智網(wǎng)是全國最大的生物醫(yī)藥、化工在線交易平臺,其中的藥智數(shù)據(jù)是中國主流醫(yī)藥數(shù)據(jù)庫之一,擁有藥品研發(fā)、生產(chǎn)檢驗(yàn)、合理用藥、市場信息、中藥材、醫(yī)療器械、食品安全、...
原始數(shù)據(jù)在文章開頭的鏈接里啦,或者百度搜索一下也有~
Excel數(shù)據(jù)分析——Olist Store巴西電商數(shù)據(jù)分析一、背景介紹 Olist Store是巴西最大的一家在線百貨公司,各個商家可以通過 Olist Store 來售賣他們的產(chǎn)品,并通過 Olist Store 的合作物流伙伴來...
小伙伴們大家好~o( ̄▽ ̄)ブ我是菜菜,這里是我的sklearn課堂第5期:sklearn中的邏輯回歸~ 我的開發(fā)環(huán)境是Jupyter lab,所用的庫和版本大家參考:Pyt...
R與RStudio的安裝1.什么是R R是用于統(tǒng)計(jì)分析、繪圖的語言和操作環(huán)境。R是屬于GNU系統(tǒng)的一個自由、免費(fèi)、源代碼開放的軟件,它是一個用于統(tǒng)計(jì)計(jì)算和統(tǒng)計(jì)制圖的優(yōu)秀工具。簡單來說,R是一門統(tǒng)計(jì)計(jì)...
一、數(shù)據(jù)來源 手寫數(shù)字?jǐn)?shù)據(jù)集 digit recognizor.csv 二、模型選擇 降維算法選擇decomposition模塊下的PCA隨機(jī)森林算法RandomForest...
一、數(shù)據(jù)來源 Sklearn自帶數(shù)據(jù)集fetch_lfw_people 二、模型選擇 降維使用Sklearn的decomposition模塊下的PCA 三、分析過程 1)導(dǎo)入...
一、數(shù)據(jù)集 Kaggle泰坦尼克數(shù)據(jù)集train.csv 二、模型選擇 泰坦尼克數(shù)據(jù)集是二分類模型,本文選擇使用隨機(jī)森林模型進(jìn)行調(diào)參。 三、數(shù)據(jù)預(yù)處理 泰坦尼克數(shù)據(jù)集需要進(jìn)行...
一、數(shù)據(jù)集 Sklearn自帶數(shù)據(jù)集——乳腺癌數(shù)據(jù)集 二、模型選擇 乳腺癌數(shù)據(jù)集是二分類模型,選擇隨機(jī)森林模型進(jìn)行調(diào)參 三、調(diào)參流程 1)簡單建模,觀察模型在數(shù)據(jù)集上具體的表...
Sklearn 有專門處理缺失值的模塊 sklearn.impute.SimpleImputer,本文將探究如何用 Sklearn 中的預(yù)處理模塊中的 Impute.Simp...
當(dāng)我們拿到一份原始數(shù)據(jù),首先會查看數(shù)據(jù)的基礎(chǔ)信息,例如每一列數(shù)量統(tǒng)計(jì),內(nèi)存消耗、哪些列有缺失值等。完整的數(shù)據(jù)對于我們的數(shù)據(jù)分析工作來說意義重大,但對于實(shí)際收集數(shù)據(jù)的人卻不是,...
R與RStudio的安裝1.什么是R R是用于統(tǒng)計(jì)分析、繪圖的語言和操作環(huán)境。R是屬于GNU系統(tǒng)的一個自由、免費(fèi)、源代碼開放的軟件,它是一個用于統(tǒng)計(jì)計(jì)算和統(tǒng)計(jì)制圖的優(yōu)秀工具。簡單來說,R是一門統(tǒng)計(jì)計(jì)...
1. 項(xiàng)目背景 泰坦尼克號是當(dāng)時世界上體積最龐大、內(nèi)部設(shè)施最豪華的客運(yùn)輪船,于1909年3月31日動工建造,,912年4月2日完工試航。于1912年4月10日,在南安普敦港的...
從Excel到Python:最常用的36個Pandas函數(shù) 本文涉及pandas最常用的36個函數(shù),通過這些函數(shù)介紹如何完成數(shù)據(jù)生成和導(dǎo)入、數(shù)據(jù)清洗、預(yù)處理,以及最常見的數(shù)據(jù)...
有什么問題...我的沒問題...
Python TextRank4ZH 應(yīng)用TextRank算法提取中文文本關(guān)鍵詞、關(guān)鍵詞組、關(guān)鍵句關(guān)鍵詞提取有很多種方法,目前比較常用的兩種方法,一種是TFIDF算法,一種是TextRank算法。 本文此次采用的是TextRank算法。TextRank算法是一種文本排序算...
一、背景介紹 Olist Store是巴西最大的一家在線百貨公司,各個商家可以通過 Olist Store 來售賣他們的產(chǎn)品,并通過 Olist Store 的合作物流伙伴來...
一、藥智網(wǎng)介紹 藥智網(wǎng)是全國最大的生物醫(yī)藥、化工在線交易平臺,其中的藥智數(shù)據(jù)是中國主流醫(yī)藥數(shù)據(jù)庫之一,擁有藥品研發(fā)、生產(chǎn)檢驗(yàn)、合理用藥、市場信息、中藥材、醫(yī)療器械、食品安全、...