因為負責(zé)一個新聞推薦系統(tǒng)的項目,需要采集大量的新聞數(shù)據(jù)作為文本分類的材料,通過自己的不斷摸索,以知乎上某位大牛的框架為基礎(chǔ),完成了一個能采集幾十萬新聞數(shù)據(jù)的爬蟲,并且健壯性非...
IP屬地:北京
因為負責(zé)一個新聞推薦系統(tǒng)的項目,需要采集大量的新聞數(shù)據(jù)作為文本分類的材料,通過自己的不斷摸索,以知乎上某位大牛的框架為基礎(chǔ),完成了一個能采集幾十萬新聞數(shù)據(jù)的爬蟲,并且健壯性非...