04_簡單的爬蟲cheerio基于node.js

基于node.js

1、 先去安裝 cheerio模塊

2、且要獲取http 或者 https

3、var url = "http//:www.news/baidu.com"

4、通過 http.get()去獲取

http.get(url,function(response){

// 4.1開始爬數(shù)據(jù)

var str =""; //(存儲數(shù)據(jù))

response.on("data",function(chunk){

str+=chunk;

})

//4.2、結(jié)束

response.on("end",function(){

// 為實例化渲染數(shù)據(jù) cheerio

// decodeEntities:false? 解碼

var $ = cheerio.load(str, decodeEntities:false);

var arr = []; //真的數(shù)據(jù)

//(ul li)去查看你要想數(shù)據(jù)的class或者id名,用法同jq

$("ul li ").each(function(){

arr.push({

title:$(this).find('.gname').html(),

img:$(this).find('a').html(),

xj: $(this).find(".xj b").html(),

yj:$(this).find(".yj em").html()

});

})

console.log(arr); //打印出自己的

可以在這里去寫 在mongoDB插入數(shù)據(jù)的代碼第四步4

就可以把爬到的數(shù)據(jù)放到數(shù)據(jù)庫之中

})

})

文章同步上一片

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內(nèi)容

  • 單例模式 適用場景:可能會在場景中使用到對象,但只有一個實例,加載時并不主動創(chuàng)建,需要時才創(chuàng)建 最常見的單例模式,...
    Obeing閱讀 2,320評論 1 10
  • 工廠模式類似于現(xiàn)實生活中的工廠可以產(chǎn)生大量相似的商品,去做同樣的事情,實現(xiàn)同樣的效果;這時候需要使用工廠模式。簡單...
    舟漁行舟閱讀 8,131評論 2 17
  • 數(shù)組方法里push、pop、shift、unshift、join、split分別是什么作用。(*) (push、p...
    coolheadedY閱讀 835評論 0 0
  • 以下是常用的代碼收集,學習用。轉(zhuǎn)自豪情博客園 1. PC - js 返回指定范圍的隨機數(shù)(m-n之間)的公式 re...
    自由加咖啡閱讀 1,119評論 0 1
  • 1.簡書 koa是由Express原班人馬打造,致力于成為一個更小、更富有表現(xiàn)力、更健壯的Web框架。使用koa編...
    不去解釋閱讀 2,802評論 0 11

友情鏈接更多精彩內(nèi)容