小作品: Python QQ 群爬蟲 (Update 2017-12-31)

GitHub https://github.com/caspartse/QQ-Groups-Spider

QQ-Groups-Spider (v0.3.0)

QQ Groups Spider(QQ 群爬蟲)

批量抓取 QQ 群信息,包括群名稱、群號(hào)、群人數(shù)、群主、地域、分類、標(biāo)簽、群簡(jiǎn)介等內(nèi)容,返回 XLS / CSV / JSON 結(jié)果文件。

代碼說(shuō)明

測(cè)試環(huán)境

  • BunsenLabs GNU/Linux 8.9 (Hydrogen)
  • Windows XP Service Pack 3 (on VirtualBox)
  • Python (2.7)

第三方庫(kù)支持

本地運(yùn)行

$ python app.py

SAE 上運(yùn)行

按照 https://www.sinacloud.com/doc/sae/python/tutorial.html#bottle 說(shuō)明配置即可。

Demo

在線演示

http://kagent.applinzi.com/qqun

截圖示例

screenshot_01.png
screenshot_02.png

致謝

@小木哥1

更新日志

  • 2017-12-31 v0.3.0 支持多個(gè)關(guān)鍵詞(返回 zip 壓縮包);頁(yè)面優(yōu)化;(暫時(shí))移除 XlsxWriter 模塊。
  • 2017-07-27 v0.2.0 更換新接口;優(yōu)化模板頁(yè)面;增加群上限、地域、分類、標(biāo)簽等字段;新增導(dǎo)出 JSON 格式。
  • 2016-02-19 v0.1.2 更新二維碼驗(yàn)證參數(shù)。
  • 2016-08-19 v0.1.1 改善代碼邏輯;加入 XlsxWriter 模塊;增加本地運(yùn)行支持。
  • 2016-07-23 v0.1.0 初始化。
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容