一、項(xiàng)目背景 2017年8月,“李文星遭BOSS直聘求職詐騙誤入傳銷死亡”事件,讓網(wǎng)絡(luò)求職詐騙第一次大規(guī)模曝光在大眾視野范圍內(nèi)。此后,網(wǎng)絡(luò)招聘平臺(tái)的高薪高待遇詐騙、培訓(xùn)貸詐騙...
作為數(shù)據(jù)分析師,使用的最多的莫過(guò)于SQL語(yǔ)句,這里拿幾道典型的SQL面試題為例,學(xué)習(xí)一下數(shù)據(jù)庫(kù)知識(shí)。自己搭建MySQL服務(wù)器太麻煩,可以使用在線數(shù)據(jù)庫(kù) 發(fā)現(xiàn)sqlzoo是個(gè)不...
1.案例說(shuō)明 一般案例客戶聚類分析流程(個(gè)人理解) 提取客戶消費(fèi)行為變量 對(duì)提取的行為變量進(jìn)行正態(tài)化(使聚類結(jié)果更有商業(yè)解讀意義),和Z-score處理(消除綱量) 對(duì)處理后...
1.讀取csv 2. 查看字段類型 同pandas [('PassengerId', 'int'),('Survived', 'int'),('Pclass', 'int')...
1. 連接本地spark 2. 創(chuàng)建DataFrame 2.1 從變量創(chuàng)建 2.2 使用自動(dòng)類型推斷的方式創(chuàng)建dataframe 2.3 讀取json文件 2.4 讀取csv...
1.案例說(shuō)明 數(shù)據(jù)來(lái)源狗熊會(huì),數(shù)據(jù)完整,無(wú)缺失值,錯(cuò)誤值通過(guò)網(wǎng)球運(yùn)動(dòng)的技術(shù)指標(biāo)探究運(yùn)動(dòng)員的技術(shù)水平對(duì)世界排名的影響 2.變量修改及探索性分析 讀取數(shù)據(jù) 男性運(yùn)動(dòng)員數(shù)據(jù) 男性運(yùn)...
1.案例說(shuō)明 通過(guò)已知獲救數(shù)據(jù),預(yù)測(cè)乘客生存情況 2.查看數(shù)據(jù) 3.數(shù)據(jù)預(yù)處理 其中Age,Cabin,Embarked有缺失值A(chǔ)ge變量缺失率19%,填充中位數(shù)Cabin缺...
1. 案例說(shuō)明 通過(guò)收集相關(guān)網(wǎng)站對(duì)酒店評(píng)價(jià),poi地理數(shù)據(jù),和酒店自身介紹探索影響酒店入住價(jià)格的因素?cái)?shù)據(jù)來(lái)源:狗熊會(huì) 2.變量分析探索 查看酒店價(jià)格分布,酒店價(jià)格集中在100...
生成可視化決策樹(shù)代碼 錯(cuò)誤解決方式 下載安裝GraphViz(這是一個(gè)獨(dú)立軟件)https://graphviz.gitlab.io/_pages/Download/Down...
1. mysql不是內(nèi)部或外部命令 安裝Mysql后,當(dāng)我們?cè)赾md中敲入mysql時(shí)會(huì)出現(xiàn)‘Mysql’不是內(nèi)部或外部命令,也不是可運(yùn)行的程序或其處理文件 解決方案:控制面...
案例背景 案例來(lái)源《python數(shù)據(jù)科學(xué):技術(shù)詳解與商業(yè)實(shí)踐》數(shù)據(jù)下載地址該案例使用一套來(lái)自某銀行真實(shí)數(shù)據(jù)集構(gòu)建貸款違約預(yù)測(cè)模型 本案例遵循數(shù)據(jù)挖掘項(xiàng)目通用流程CRISP-D...
1. 案例背景 國(guó)內(nèi)某航空公司面臨客戶流失,競(jìng)爭(zhēng)力下降和航空資源未充分利用等經(jīng)營(yíng)危機(jī)。 通過(guò)建立合理的客戶價(jià)值評(píng)估模型,對(duì)客戶進(jìn)行分群,分析比較不同客戶群的客戶價(jià)值,并制定相...
1. 聚類分析的典型應(yīng)用場(chǎng)景 聚類分析的一個(gè)重要用途就是針對(duì)目標(biāo)群體進(jìn)行多指標(biāo)的群體劃分,類似這種目標(biāo)群體的分類就是精細(xì)化經(jīng)營(yíng),個(gè)性化運(yùn)營(yíng)的基礎(chǔ)和核心,只有進(jìn)行了正確的分類,...