久久久久久AV蜜臀,久久久精n,69色操综合网

發(fā)簡(jiǎn)信

ddm2014

11
關(guān)注
26
粉絲
55
文章
22217

字?jǐn)?shù)
65

收獲喜歡
5

總資產(chǎn)

IP屬地：四川

ddm2014

爬豆瓣豆列
目的：把精彩豆列頻道里的每個(gè)豆列里的內(nèi)容抓取出來(lái)。流程是抓取目錄頁(yè)精彩豆列頻道豆列的地址-對(duì)每個(gè)豆列所有頁(yè)數(shù)都抓取具體內(nèi)容、網(wǎng)址、時(shí)間。這就很標(biāo)準(zhǔn)crawlspider干的活...

1438 0 0
ddm2014

驗(yàn)證碼去除干擾線
在邦購(gòu)登陸時(shí)，選擇了人工檢驗(yàn)驗(yàn)證碼，這次用機(jī)器檢測(cè)試試。先說(shuō)基本邏輯：載入圖像，轉(zhuǎn)灰度，二值化，連通域檢測(cè)，去除連通域小的，根據(jù)各連通域的范圍切割圖像。先下載圖片。得到的...

11728 1 2

ddm2014

ng deep learning 學(xué)習(xí)筆記
先快速搭建一個(gè)神經(jīng)網(wǎng)絡(luò)，看看訓(xùn)練集效果，調(diào)整，看dev集的cv效果，調(diào)整，看test集效果，調(diào)整，最后看實(shí)際數(shù)據(jù)的效果，再調(diào)整。

365 0 0
ddm2014

爬今日頭條，各種失敗經(jīng)驗(yàn)，之后成功了
最近研究了一下js加密，發(fā)現(xiàn)今日頭條比較適合練手，在頭條獲取數(shù)據(jù)的XHR中request參數(shù)有一項(xiàng)_signature參數(shù)，這個(gè)是就是經(jīng)過(guò)js加密的數(shù)據(jù)。解決方案在最后。復(fù)...

11553 2 6
ddm2014

辰辰沉沉沉
寫了 25360 字，被 25 人關(guān)注，獲得了 42 個(gè)喜歡
ddm2014

scrapy 關(guān)于session
在requests用session登陸這篇講了怎么用同一個(gè)session控制cookies以達(dá)到登陸的需求，在scrapy里主要用的是FormRequest和cookieja...

5876 0 1
ddm2014

scrapy用proxy的零零總總
在scrapy框架及中間件中說(shuō)到了中間件相關(guān)的數(shù)據(jù)流程，剛好在用proxy爬數(shù)據(jù)的時(shí)候會(huì)用到中間件的零零總總，這回可以一起說(shuō)說(shuō)了。我覺(jué)得寫中間件要先找到內(nèi)置的相關(guān)中間件，根據(jù)...

2333 0 4

ddm2014

爬金融數(shù)據(jù)
最喜歡的爬取的就是由前端數(shù)據(jù)，返回的json全是數(shù)據(jù)特別好弄，而且還可以根據(jù)需求構(gòu)造網(wǎng)址，一次取回所需數(shù)據(jù)。這次爬的是東方財(cái)富網(wǎng)的股東人數(shù)，地址是http://data.ea...

777 0 0
ddm2014

python -裝飾器
裝飾器之前要先說(shuō)說(shuō)函數(shù)名（）和函數(shù)名的區(qū)別 test()是返回函數(shù)值，所以是可以賦值給變量的。比如a=test()。test是調(diào)用函數(shù)，在scrapy里有很多的callbac...

297 0 0
ddm2014

scrapy_redis分布式爬蟲
說(shuō)到redis了，自然就要說(shuō)到另一個(gè)爬蟲框架scrapy_redis，分布式爬蟲，scrapy與scrapy_redis最大的不同是scheduler，也正是因?yàn)檫@個(gè)sche...

421 0 0
ddm2014

scrapy框架及中間件
scrapy框架官方圖如下基本流程是1.spider發(fā)出初始request需求，默認(rèn)是對(duì)start_urls發(fā)起get方法的request，如果帶參數(shù)或者post就重寫st...

2752 0 1
ddm2014

scrapy+redis增量爬蟲
scrapy適合一次性爬取全站，如果我想多次爬取，主目錄頁(yè)面難免會(huì)出現(xiàn)重復(fù)，去重增量爬取就很有必要了。我在網(wǎng)上搜到了這樣的文章scrapy+redis增量爬取,邏輯是前一次存...

2479 1 4

ddm2014

爬m(xù).weibo站
最近需要一些拍照的指導(dǎo)，想爬取微博里的相冊(cè)，m站比pc站好爬，先看看pc的network。順利找到網(wǎng)址，不過(guò)pc的分頁(yè)方式讓我分方，感覺(jué)像是開始以為是時(shí)間戳，可能是圖片的數(shù)據(jù)...

2363 0 1
ddm2014

用python寫爬蟲-re模塊
re模塊中最常用到三個(gè)函數(shù)的是match，search，findall。不過(guò)他們都能匹配字符串，不過(guò)又稍有不同。基本格式 re.findall/match/search("...

577 0 0
ddm2014

sklearn-loss function
我認(rèn)為各個(gè)模型核心就是loss function，loss function不同就是不同的模型，具有相同的loss function大體也就相同，可能只是一個(gè)是分類，一個(gè)是回...

2547 0 0
ddm2014

sklearn-4.11邏輯回歸，SVM，SGDClassifier的應(yīng)用
模型選擇：前面說(shuō)了邏輯回歸和SVM的區(qū)別和聯(lián)系，主要是線性是否可分，但是實(shí)際二分類中特征向量維數(shù)起碼數(shù)十，成百上千的，雖說(shuō)降維之后看看特征是否能夠線性可分，但再加上數(shù)據(jù)本身...

9783 0 3
ddm2014

sklearn-4.1邏輯回歸，SVM
sklearn前面有過(guò)一個(gè)樹狀圖，大概說(shuō)了什么情況用什么模型合適。監(jiān)督學(xué)習(xí)分類模型，主要有邏輯回歸LogisticRegression，支持向量機(jī)svm，神經(jīng)網(wǎng)絡(luò)，近鄰KN...

1343 0 4

ddm2014

requests和pandas聯(lián)合爬代理ip，驗(yàn)證ip
最近需要找個(gè)代理上網(wǎng)，但是網(wǎng)上免費(fèi)的ip實(shí)在是不太好用，隨機(jī)找到好用ip的概率實(shí)在有點(diǎn)小，就只能把它們都下下來(lái)挨個(gè)試。我爬的是西刺代理-高匿，翻看兩頁(yè)，想看看數(shù)據(jù)來(lái)源，完了是...

1616 0 0
ddm2014

sklearn-5.評(píng)價(jià)選擇model
sklearn.model_selection就是選擇模型的額，主要方法是cross_val_score，主要是把原始數(shù)據(jù)拿出一部分來(lái)做驗(yàn)證，看訓(xùn)練的怎么樣，就像考試一樣，考...

538 0 0
ddm2014

sklearn-3.預(yù)處理數(shù)據(jù)
導(dǎo)入數(shù)據(jù)之后要做的是預(yù)處理，sklearn.preprocessing，主要分為幾個(gè)方面。1.缺失值的處理缺失值我覺(jué)得用pandas來(lái)處理更方便，pandas.fillna，...

340 0 1

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九 欧美,1769亚洲,黄色成人av

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av