
前段時間天知乎社區(qū)用戶@吳清源的一篇文章火了,還沒看過文章的可以在知乎搜索《我收到了Angelababy的投訴,很抱歉,是我們降低了楊穎小姐的社會評價》,楊穎小姐作為流量明星的代表,一邊靠流量為生、一邊卻偏偏想以演技好自居。
我為什么要提到這篇文章呢?這篇文章截至我開始寫文章前已經獲得了13.9萬以上的贊同、2.8k的贊賞人數、1萬多評論,這是什么概念呢?知乎社區(qū)目前最高贊的回答贊同數量只有14萬贊。
這樣的數據觸目驚心,轉回一想似乎又有道理又無道理,有道理在現(xiàn)在全宇宙都在抨擊這種流量明星所以有這么好的抨擊文章像是星星之火;沒道理在,既然大家都討厭流量明星,那么誰在為流量明星買單?
我們以流量明星Angelababy為例。
1、百度指數(注意從百度指數看的人群是習慣使用百度人人群,所以該指標下的所有統(tǒng)計都是基于百度用戶的畫像)
從百度搜索指數人群年齡以及性別上看:習慣使用百度人人群中為Angelababy流量買單的人主要是30~39歲的人,占到整體人群年齡段的60%左右;性別方面,為Angelababy流量買單的主要是女性同樣以60%多的比例高于男性

從地域上看,出乎意料為Angelababy流量買單人數最多省份竟然是浙江,而最多人數的城市是Angelababy的出生地:上海


關心流量明星Angelababy的人都在關心她的什么呢?從關鍵詞需求圖譜,我們發(fā)現(xiàn)關注Angelababy的大部分關注的是:他的老公黃曉明、孩子、趙麗穎(大家好像很愿意拿她們倆做對比)、演技一樣差的唐嫣、整容事件。


2、微博評論(注意從微博評論看的人群是習慣使用微博的人群,所以該指標下的所有統(tǒng)計都是基于新浪微博用戶的畫像)
我選取了Angelababy的一條相對比較顯著的微博,共計有20377條轉發(fā),用Python爬蟲把轉發(fā)人的的基本信息都抓取下來。
整個微博的轉發(fā)路徑為,最高層為第六層(下圖數據來自北京大學 PKUVIS 微博可視分析工具):


女性比例為59.4%幾本與百度指數基本吻合,而在省份比例中我們會驚訝地發(fā)現(xiàn)在微博上給Angelababy帶來流量最大的竟然是:廣東、江蘇、北京三個地區(qū)。
同時,新浪微博的用戶相對偏年輕,我們看一下新浪微博用戶中的Angelababy的粉絲的年齡層分布,從圖中我們會發(fā)現(xiàn)Angelababy的新浪微博粉絲年齡大部分集中在12~28歲,并且是隨著年齡的減小,粉絲數量遞增,在12歲達到最高。

另外,在上面做統(tǒng)計的時候,我需要刪除一些單個用戶多次評論的情況以確保統(tǒng)計結果的正確性,在去重復的過程中我有一個比較驚奇地發(fā)現(xiàn):
Angelababy的粉絲真的那么多嗎?我們看看在這些評論中疑似水軍、或者一些腦殘粉即瘋狂刷屏的人有多少,這樣我們才能了解到真實數據。
從單用戶轉發(fā)次數我們提取單一用戶轉發(fā)次數超過100次的用戶,如下圖所示,其中甚至用戶名為青澀鼻鼻,用戶id為5729949390的用戶轉發(fā)單條微博超過591次,此條微博的總共轉發(fā)次數為20000多次。


而在轉發(fā)時候的評論內容,內容重復次數超過90的如下,其中轉發(fā)只附有一個表情的就有924次。

如果對重復多次的內容,對這些數據刷子新浪微博用戶進行刪除去重、重復多次的id進行刪除,我們得到的真實數據是:7002條轉發(fā),占總轉發(fā)的35.3%,超過百分之五十的都是無意義的重復內容或者單人重復評論。
所以,Angelababy的粉絲也不是新浪微博那些數據看上去的那么可怕,不過是腦殘粉太多,如果少了一些腦殘粉,世界會清靜了很多吧。