1.前言 RFM模型即"R"——Recency(最近一次消費時間)、"F"——Frequency(一段時間內(nèi)消費頻次)、"M"——(一段時間內(nèi)消...
1.數(shù)據(jù)爬取 鏈接:https://pan.baidu.com/s/1zaTqNY2eCzGyYzesDw0LPw提取碼:5h8d鏈接是我自行在...
1.數(shù)據(jù)集的導(dǎo)入以及自變量和因變量的選取 作為機器學(xué)習(xí)的入門知識點和模型,網(wǎng)上有很多sklearn庫實現(xiàn)線性回歸的例子。不過在這里我會從最開始的...
用戶分層 緊接著上一篇文章,現(xiàn)在我們來分析下不同用戶(游客)的分層: 建立一個數(shù)據(jù)透視表,并先將所有的NAN值改成0,購買過2次及以上的游客統(tǒng)統(tǒng)...
分析內(nèi)容 針對臺北101門票的銷售情況數(shù)據(jù),做一些簡單的數(shù)據(jù)分析 每天的銷售量 銷售量最高和最低日期分布 游客購買次數(shù)密度 游客購買次數(shù)百分比 ...
接著上一篇的內(nèi)容,接下來分析下公司行業(yè)背景的數(shù)量分布 3.2 公司行業(yè)分布情況 原數(shù)據(jù)中行業(yè)分布,有些公司用、代替了,作為分隔符,所以需要用上面...
本項目的數(shù)據(jù)來源是2019年拉勾網(wǎng)——上海的數(shù)據(jù)分析崗位的信息 首先第一步:爬取數(shù)據(jù) 爬取的代碼就不貼上來了,有很多種,本人的爬蟲水平僅限于Be...