引言
在第一篇文章中【Py大法系列--01】20多行代碼生成你的微信聊天機(jī)器人中,我們通過Python第三方庫itchat實(shí)現(xiàn)了一個自動聊天的機(jī)器人,是不是覺得很有趣和很有用呢?在文章的結(jié)尾我們也提到了用itchat可以實(shí)現(xiàn)很多實(shí)用的功能,今天就結(jié)合幾大常用的Python數(shù)據(jù)分析包,結(jié)合itchat的能力實(shí)現(xiàn)朋友圈的分析。
從哪里做起
微信現(xiàn)在越來越融入到了我們每個人的生活,從簡單的聊天工具到衣食住行的服務(wù),再到傳播著豐富多彩信息的自媒體和涵蓋萬物的小程序,微信儼然就是一個小的生態(tài)系統(tǒng)。而人,是整個微信生態(tài)的核心,每個人朋友圈就是自我小生態(tài)的核心。itchat為我們提供了獲取朋友信息的接口:
friends=itchat.get_friends(update=True)[0:]
通過debug可以看到每個friend的信息:可以看到每個好友的信息還是很豐富的,從昵稱、性別、到地域等,好友列表按照通訊錄排列,第一個是用戶自己,接著是星標(biāo)置頂?shù)暮糜?,比如瑾瑾在我的列表里排第一位。我們今天所有的工作都將從好友的信息做起?/p>
統(tǒng)計(jì)好友性別分布
性別分布是最容易統(tǒng)計(jì)的數(shù)據(jù),通過查看我自己和幾個好友的數(shù)據(jù),得出sex和性別的對應(yīng)關(guān)系為:
sex = 0: 未知sex = 1: 男生sex = 2: 女生
pyecharts 是一個用于生成 Echarts 圖表的類庫,而Echarts 是百度開源的一個數(shù)據(jù)可視化 JS 庫。主要用于數(shù)據(jù)可視化。利用pyecharts畫出好友性別分布:
from pyecharts import Pieboy=girl=nothing=0for i in friends[1:]: sex =i["Sex"] if sex==1: boy+=1 elif sex==2: girl+=1 else: nothing+=1total=len(friends[1:])attr =["迷妹","迷弟" , "低調(diào)的匿名粉絲"]v1 =[boy,girl, nothing]pie = Pie("粉絲性別分布", title_pos='center')pie.add("", attr, v1, radius=[40, 75], label_text_color=None,is_label_show=True ,is_legend_show=False)pie.show_config()pie.render("./sex_data.html")
運(yùn)行結(jié)果如下:
沒想到我的微信上的迷妹竟然比迷弟都多了這么多,實(shí)在是吃鯨,還希望瑾瑾不要打我。
好友地域分布
分析完好友的性別我們再來分析好友的地域分布,看看自己的好友是不是遍布天南地北:
from pyecharts import Mapimport pandas as pddef get_var(var): variable=[] for i in friends: value=i[var] variable.append(value) return variableNickName=get_var("NickName")Sex=get_var("Sex")Province=get_var('Province')Signature=get_var('Signature')city=get_var('City')data={'NickName':NickName,'Sex':Sex,'Province':Province,'Signature':Signature,'city':city}frame=pd.DataFrame(data)result1=frame.groupby(['Province'],as_index=False).size()a1=list(result1)a2=result1.indexmap=Map("我的好友占了大半個中國?。?, "來自微信的朋友圈", title_pos="center",width=1200, height=600)map.add("", a2, a1, maptype='china', is_visualmap=True, visual_text_color='#000',visual_range=[1, 8], is_label_show=True, symbol="diamon", label_pos="inside" )map.show_config()map.render("./area_data.HTML")
最后的結(jié)果如下:
非常地準(zhǔn),作為一個飄過北、上、杭的“浪里白條”,除了老家河南,我的好友基本集中在上海、北京和杭州,什么時候也可以到廣深溜一波。
好友個性簽名詞云分析
微信簽名是了解一個人性格和態(tài)度的重要參考,想看看我的朋友圈里的大神們都是走的文藝風(fēng),還是小清新,還是大學(xué)霸… …話不多說,一試便知:jieba(結(jié)巴)是一個強(qiáng)大的分詞庫,完美支持中文分詞;wordcloud是一個基于Python的詞云生成類庫,很好用;matplotlib.pyplot是一些命令行風(fēng)格函數(shù)的集合,使matplotlib以類似于MATLAB的方式工作。每個pyplot函數(shù)對一幅圖片(figure)做一些改動:比如創(chuàng)建新圖片,在圖片創(chuàng)建一個新的作圖區(qū)域(plotting area),在一個作圖區(qū)域內(nèi)畫直線,給圖添加標(biāo)簽(label)等:
import reimport jiebaimport wordcloud as wcimport numpy as npimport PIL.Image as Imageimport matplotlib.pyplot as pltsiglist=[]for i in friends: signature=i['Signature'].strip().replace("span","").replace("class","").replace("emoji","") rep=re.compile("1f\d+\w*|[<>/=]") signature=rep.sub("",signature) siglist.append(signature)text="".join(siglist)wordlist=jieba.cut(text,cut_all=True)word_space_split=" ".join(wordlist)coloring = np.array(Image.open("./1.jpg")) # 一張猴子圖片,試了很多照片,還是這個好my_wordcloud = wc.WordCloud(background_color="white", # 背景顏色 mask=coloring, max_words=200, # 最大詞數(shù) max_font_size=60, # 字體最大值 random_state=42, scale=4, # 按照比例進(jìn)行放大畫布,如設(shè)置為1.5,則長和寬都是原來畫布的1.5倍。 font_path="./HYQiHei-25J.ttf", # 字體,注意選擇合適的字體,否則可能會顯示亂碼。 width=400, height=200 # 像素 ).generate(word_space_split)image_colors = wc.ImageColorGenerator(coloring)# plt.imshow(my_wordcloud.recolor(color_func=image_colors))plt.imshow(my_wordcloud)plt.axis("off") # 不顯示坐標(biāo)軸plt.show()my_wordcloud.to_file('./test.jpg')
最后的結(jié)果如下:
對于詞云的分布也是有很多可以挖掘的信息,看起來我的朋友們比較偏向于文藝風(fēng)。愛自己、愛生活、有夢想、擁抱世界。我還在右下角的角落里看到了低調(diào)的我交。
后記
微信是一個神奇的存在,它是一個國民級別的全民APP,所以,微信的產(chǎn)品設(shè)計(jì)一直都是一個有趣的現(xiàn)象,從最初底部Tab的數(shù)目、每個Tab的名稱、"發(fā)現(xiàn)"頁面的定制、小程序入口、朋友圈入口到朋友圈評論等等一系列的設(shè)計(jì)細(xì)節(jié),都是值得我們透過人性和心理去研究的。即使是被人們封神的"張小龍",在面對結(jié)構(gòu)最為復(fù)雜的中國用戶群體的時候,他的瀟灑中依舊不免充滿無奈,從對朋友圈的置之不理就可以看出,這是一個怎么做都不會讓人滿意的功能,任何一個生態(tài)在面對巨大的用戶群體的時候,功能的增減就會變成一個難題。當(dāng)然,上面一段是我抄的,太晚了,沒時間寫感想,該睡覺了,相信我們已經(jīng)看到了itchat和Python的巨大生產(chǎn)力,那么就關(guān)注博主的微信公眾號:“尼克毛的技術(shù)小站”,關(guān)注Py大法系列,我們一起學(xué)Python吧。