mongodb 數(shù)據(jù)庫導(dǎo)出csv文件
- 找到mongoexport所在文件夾,選中文件夾,右鍵shift,選在此處打命令窗口
- 進(jìn)入cmd窗口,輸入以下命令
- mongoexport -d douban -c top250 --csv -f id,place,level,time,quote,name -o douban.csv
- d douban為數(shù)據(jù)庫名 c top250為新建表名 f為要導(dǎo)出的字段 o為導(dǎo)出表的名稱
- 導(dǎo)出的文件存放在bin文件夾中,會(huì)發(fā)現(xiàn)亂碼
- 用記事本打開選擇UTF-8保存再用excel打開即不會(huì)亂碼
沈夢辰微博評(píng)論爬取
hello world
import requests
import json
import time
import pymongo
client = pymongo.MongoClient('localhost', 27017)
weibo = client['weibo']
comment_shengmengc = weibo['comment_shengmengc']
headers = {
"Cookies":'xxxxxxxxxxx',
"User-Agent":'Mozilla/5.0 (iPhone; CPU iPhone OS 9_1 like Mac OS X) AppleWebKit/601.1.46 (KHTML, like Gecko) Version/9.0 Mobile/13B143 Safari/601.1'
}
url_comment = ['http://m.weibo.cn/api/comments/show?id=4060977869675098&page={}'.format(str(i)) for i in range(0,1000)]
def get_comment(url):
wb_data = requests.get(url,headers=headers).text
data_comment = json.loads(wb_data)
try:
datas = data_comment['data']
for data in datas:
comment = {"comment":data.get("text")}
comment_shengmengc.insert_one(comment)
except KeyError:
pass
for url in url_comment:
get_comment(url)
time.sleep(2)
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。