色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

登錄注冊寫文章

Python爬蟲-同花順行業(yè)歷史數(shù)據(jù)及成分股

丨像我這樣的人丨

Python爬蟲-同花順行業(yè)歷史數(shù)據(jù)及成分股

所有板塊

板塊歷史走勢

成分股

行業(yè)歷史數(shù)據(jù)

成分股爬取存儲

1. Q:如何獲取板塊日線K線圖中的數(shù)據(jù)？

? ? A：圖中的K線圖不是flash動畫，鼠標移動，是會顯示每天的價格情況，因此猜測是JS動態(tài)加載生成的通過F12抓包無找到相應(yīng)的js文件運氣使然無意間點到K線圖的+-縮放鍵新增了兩個文件 2017.js、2018.js 里面便有想要的數(shù)據(jù)，分別是17年和18年每天的數(shù)據(jù) 數(shù)據(jù)格式對應(yīng)為日期、開盤價、最高價、最低價、收盤價、成交量、成交額? 獲取即可

2. Q：2017.js和2018.js的網(wǎng)址打開或者requests后并無相應(yīng)數(shù)據(jù)，如何解決？如半導(dǎo)體及元件板塊的js網(wǎng)址是http://d.10jqka.com.cn/v4/line/bk_881121/01/2017.js 打開后是404

? ?A:requests添加headers屬性 headers屬性中添加user-agent、Referer和Cookie

headers屬性

3. Q：cookie容易失效沒爬幾個網(wǎng)址就失效了，該如何解決？

????A：因為沒有登錄所以網(wǎng)址給的是臨時cookie 極其容易失效兩個解決辦法：1：注冊一個同花順賬號登陸后給的cookie失效更長 2.用 selenium模擬瀏覽器登錄，獲取每次的臨時cookie 這樣就不會失效

我選擇了第二種方法第一種方法使用賬號的cookie，容易被封賬號，也懶得注冊一個賬號第二種方法的缺點就是每次都會打開一個瀏覽器有點耗內(nèi)存不過實測沒問題?

4. Q:用selenium模擬登陸，每次都會彈出瀏覽器一閃一閃? 光速開始又光速關(guān)閉就像老有人在眼前晃如何解決？

????A：使用無頭模式即表面不看到瀏覽器和PhantomJS一樣那為啥不用PhantomJS呢因為selenium不再支持了嘛

Chrome無頭模式

5.Q:獲取成分股中有的板塊只有一個有的有多頁如何批量處理？

不同板塊的成分股

????A：判斷有沒有“1/N”這樣的標簽如果有則保存N 循環(huán)每一頁到N位置如圖中是1/4 獲取4這個數(shù) 然后從1,2,3,4 循環(huán)到4? 修改網(wǎng)頁中的page即可沒有標簽則默認取第一頁

用try except 實現(xiàn)判斷有無標簽? 并用yield url 保存網(wǎng)址

6.Q:抓取行業(yè)歷史數(shù)據(jù)及成分股耗時比較長如單一個成分股先保存所有的行業(yè)代碼再進入行業(yè)的主頁再獲取當前頁成分股再點擊下一頁直到?jīng)]有共有保存了3500多只股票及對應(yīng)的成分股耗時半小時有沒有辦法加快爬取速度？

????A：使用多線程? 開啟pool池實測半小時縮短為15分鐘還是有點效果的

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成，瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明：文章內(nèi)容（如有圖片或視頻亦包括在內(nèi)）由作者上傳并發(fā)布，文章內(nèi)容僅代表作者本人觀點，簡書系信息發(fā)布平臺，僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

深入理解Cookie和Session機制
目錄Cookie機制什么是CookieCookie的不可跨域名性Unicode編碼：保存中文BASE64編碼：保存...
Tomatoro閱讀 17,045評論 7贊 186
理解Cookie和Session機制
會話（Session）跟蹤是Web程序中常用的技術(shù)，用來跟蹤用戶的整個會話。常用的會話跟蹤技術(shù)是Cookie與Se...
chinariver閱讀 5,788評論 1贊 49

生命的意義
今晚這篇文章有些沉重，算是在歲月的磨礪中讓我更快的成長。生老病死，大自然的規(guī)律。那些無法逃避的痕跡和變化，見證了...
0城三點半閱讀 460評論 0贊 1
我知道他是人渣
我希望生命中常伴陽光我希望生活里常遇溫暖我希望情緒里常有快樂我知道他是人渣，但是我不離開他。 01 20...
龍葵豆閱讀 529評論 0贊 1
原創(chuàng)歌詞：這個雨季不再來
原創(chuàng)歌曲:這個雨季不再來作詞作曲:白衣卿相一:主歌每一個夜晚時分，總會想起曾經(jīng)愛過的人。留不住天邊晚霞，...
靜聞魚讀月槐花語閱讀 889評論 0贊 2

友情鏈接更多精彩內(nèi)容

15贊16贊

贊賞

手機看全文

吉木萨尔县| 恩平市| 满洲里市| 凤翔县| 德庆县| 四会市| 蓝田县| 临泽县| 文安县| 临西县| 昌黎县| 九江市| 滦南县| 浠水县| 赤水市| 庆安县| 图木舒克市| 灵山县| 河源市| 扎赉特旗| 南岸区| 丰台区| 改则县| 灵寿县| 奉化市| 芒康县| 油尖旺区| 虎林市| 桐乡市| 金川县| 开远市| 昌平区| 麻阳| 循化| 安国市| 博客| 贺州市| 襄汾县| 绥德县| 湖州市| 拉萨市|