爬蟲實戰(zhàn)——三大指數(shù)之微信指數(shù)(中)

(本人原創(chuàng),謝絕轉(zhuǎn)載)

繼上一篇微博指數(shù)開發(fā)文章以來,我發(fā)現(xiàn)我知乎的粉絲慢慢在上漲?。?!

分享的力量??!

不扯淡,今天給大家?guī)砣笾笖?shù)第二篇:

微信指數(shù)!

分析:

抓取微信指數(shù)當然得用微信去訪問關(guān)鍵詞,然后采用fiddler抓包,抓取到關(guān)鍵詞的數(shù)據(jù),然后訪問網(wǎng)頁接口api,并提取返回值的數(shù)據(jù)。

看似分析這么輕描淡寫,但是。。前方高能預警!

具體分析:

實現(xiàn)微信全自動的輸入關(guān)鍵詞,那么得寫個腳本控制微信(什么?。。微信還能被腳本控制?別逗我了。)目前掌握的知識點不足啊,怎么辦!!學習唄。。

果斷百度,控制微信腳本語言。。結(jié)果lua語言最好,python行嗎?不知道,貌似很少用Python控制微信的。好吧,學習lua腳本?。?!花了幾天功夫。。終于搞定,lua腳本、第三方模擬器(不推薦,怕誤會我是托)終于可以控制微信啦。

附一張lua的核心代碼圖:

但是還得控制輸入啊,別急,我用lua直接請求關(guān)鍵詞api接口就能獲取關(guān)鍵詞了??!

控制微信的問題解決了,輸入關(guān)鍵詞也解決啦??!

同時,另外一個問題又來來,微信請求過后的數(shù)據(jù)我們怎么才能提取出來了?

這里再次使用fiddler神器啊,之前我使用過fiddlercore這個模塊,它是fiddler的一個api接口,但是,我們沒找到Python去對接這個接口的文檔,所以放棄了Python的開發(fā),采用c#開發(fā)接口。

c#開發(fā)也不是難事兒(不會的大家得多學習啊,爬蟲這個坑,看似簡單,需要掌握的技能很多)

放兩張圖吧:

用的fiddlercore,c#開發(fā),讓它跑起來。!

好了 思路是通了。

編程:

lua編程,這塊沒的說,說實話不敢說太多,因為自己也不是非常懂,不敢班門弄斧了。

附一張lua腳本控制微信app的圖片:

爬蟲編程也不多說,核心的模塊分享給大家(已經(jīng)夠意思啦。。)

然后呢,就是一些修修補補,調(diào)通程序啦。

這里會有一張圖(留著,等我做好了發(fā)出來):

總結(jié)一下:

1、lua編程需要繼續(xù)提升,以后控制app基本上都可以用lua語言實現(xiàn)。

2、fiddler抓取app的數(shù)據(jù),fiddlercore的深入學習,還有好多神奇功能沒有用到。

ps:后來想了想,這種方式抓取數(shù)據(jù)的效率不是特別高,思路過后可以采用另外一種方式:抓取微信指數(shù)關(guān)鍵詞的key(微信自己產(chǎn)生),采用Python requests去做抓取,效率會提升不少!

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容