Python網(wǎng)易云音樂數(shù)據(jù)分析系統(tǒng) 爬蟲 echarts可視化 Flask框架 音樂推薦系統(tǒng) 源碼下載

Python的網(wǎng)易云音樂數(shù)據(jù)分析系統(tǒng) 爬蟲 echarts可視化 Flask框架 音樂推薦系統(tǒng)

一、技術(shù)說明

網(wǎng)易云音樂數(shù)據(jù)(歌單、用戶、歌詞、評(píng)論)Python爬取Flask框架搭建ECharts、WordCloud可視化項(xiàng)目。系統(tǒng)分為:數(shù)據(jù)采集模塊、數(shù)據(jù)分析處理模塊、數(shù)據(jù)存儲(chǔ)模塊、以及數(shù)據(jù)可視化呈現(xiàn)模塊。

項(xiàng)目目標(biāo)

1. 實(shí)現(xiàn)通過搜索關(guān)鍵詞,對(duì)相關(guān)歌曲的主要信息進(jìn)行展示

2. 對(duì)搜索出的信息進(jìn)行歌單、歌詞、評(píng)論、聽眾地域分布、活躍時(shí)間段等幾個(gè)方面的數(shù)據(jù)進(jìn)行可視化分析。

技術(shù)環(huán)境

Python3、urllib庫、Flask框架、ECharts.js、WordCloud庫、SQLite3數(shù)據(jù)庫

基本數(shù)據(jù):

1.爬取歌單預(yù)覽頁,所有歌單數(shù)據(jù),35單*38頁,(歌單詳情url)

2.爬取歌單詳情頁(歌單標(biāo)題、歌單作者、作者url、歌單創(chuàng)建日期、歌單收藏量、歌單分享量、歌單評(píng)論數(shù)、歌單標(biāo)簽、歌單介紹、歌單歌曲數(shù)量)

3.爬取歌單內(nèi)音樂(歌曲id、標(biāo)題、時(shí)長(zhǎng)、歌手、專輯、歌曲url)

4.爬取歌曲詳情(歌曲id、歌曲標(biāo)題、歌手、專輯、歌詞、評(píng)論數(shù)、評(píng)論內(nèi)容)

5.爬取歌曲歌單評(píng)論內(nèi)容(歌單歌曲辨識(shí)id、評(píng)論者id、評(píng)論者名、評(píng)論內(nèi)容、評(píng)論時(shí)間、評(píng)論點(diǎn)贊量、評(píng)論者url-地區(qū)累計(jì)聽歌量)

分析方向:

1.數(shù)據(jù)庫可視化:用戶搜索關(guān)鍵詞,完成相應(yīng)內(nèi)容可視化的展現(xiàn)。

1.數(shù)據(jù)呈現(xiàn)的多樣化:多種圖表形式。(用戶活躍時(shí)間分布、用戶地域分布、歌單標(biāo)簽排名、歌曲情緒、評(píng)論區(qū)詞云、歌單歌曲詞云、)

2.數(shù)據(jù)維度的設(shè)計(jì):能夠從不同維度的數(shù)據(jù)分析,為用戶提供更多的價(jià)值

3.界面表現(xiàn)的美化(可點(diǎn)擊保存詞云圖片,根據(jù)歌曲id生成評(píng)論區(qū)詞云、根據(jù)歌單id生成歌單詞云)




二、運(yùn)行截圖

技術(shù)

四、補(bǔ)充

設(shè)計(jì)語言:Python+SQL+HTML+CSS+JS

數(shù)據(jù)爬?。簊elenium+request+json+time+random

數(shù)據(jù)存儲(chǔ):SQLite

數(shù)據(jù)清洗:re+replace+time.localtime+time.strftime

后端搭建:PalletsFlask

前端搭建:TwitterBootstrap

圖表展現(xiàn):ApacheECharts

詞云制作:pyplot+jieba+wordcloud+Image+numpy

(1)selenium主要用webdriver來模仿認(rèn)為點(diǎn)擊爬取頁面數(shù)據(jù),request負(fù)責(zé)偽裝headers獲取頁面,json負(fù)責(zé)將獲取到的文本數(shù)據(jù)轉(zhuǎn)換為字典數(shù)據(jù)。time和random負(fù)責(zé)隨機(jī)訪問頻率。

(2)re是通過正則表達(dá)式提取一定規(guī)則的文本內(nèi)容。replace主要取出部分不要的字符。time模塊負(fù)責(zé)轉(zhuǎn)換json時(shí)間

(3)Flask通過編寫app路由處理請(qǐng)求響應(yīng),然后以render_template渲染視圖效果。

(4)jieba負(fù)責(zé)提供分詞、識(shí)詞過濾,Image負(fù)責(zé)背景圖的圖像處理,numpy負(fù)責(zé)矩陣運(yùn)算,中文顯示需要的空間,wordcloud負(fù)責(zé)形成有遮罩效果的圖形,pyplot是負(fù)責(zé)繪出最終圖形。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容