#!/usr/bin/env python
# -*- coding: utf-8 -*-
import json
import re
import urllib2
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
url='https://rate.tmall.com/list_detail_rate.htm?itemId=41464129793&sellerId=1652490016¤tPage=1'
cont=urllib2.urlopen(url).read()
rex=re.compile(r'\"rateList\":(\[.*?\])\,\"searchinfo\"')
content=rex.findall(cont)[0]
con=json.loads(content, "gbk")
count = len(con)
print len(con)
# count=len(con['rateDetail']['rateList'])
# print count
for i in xrange(count):
print str(i) + " " + con[i]['rateContent']
Python自動爬取淘寶網(wǎng)評論
最后編輯于 :
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。
相關(guān)閱讀更多精彩內(nèi)容
- 爬得我真是累,我靠,還不如其他小網(wǎng)站一個scrapy爬,爽得一批,話說,不過反爬蟲的網(wǎng)站應(yīng)該是很多很多了 真心爬得憂傷
- 這篇文章是Python爬蟲的第二篇,目標(biāo)是新浪微博的評論人的性別,地區(qū),等信息,寫的不好的地方請指正。 先來分析一...
- 一、介紹 朋友暑假實踐需要美團(tuán)外賣APP評論這一份數(shù)據(jù),一開始我想,這不就抓取網(wǎng)頁源代碼再從中提取數(shù)據(jù)就可以了嗎,...
- 這篇文章是Python爬蟲的第一篇,目標(biāo)是新浪微博的評論,本篇只實現(xiàn)了抓取評論者的id或個性域名,評論,用戶名,詳...
- 小組名稱:飛雪靜茗 腦圖說明 中心圖說明: 這次作業(yè)是用思維導(dǎo)圖記住朱自清的散文《匆匆》,這篇文章主要表達(dá)作者對時...