? 帶噶猴,為大家?guī)韓ode抓取數(shù)據(jù)(小白練習)?。。?/p>
? 在開始之前呢先檢查自己是否安裝了node,指令:node? -v(ps:應該都會)
????新建index.js文件 然后引入依賴
? ??var?express?=?require('express');
????var?superagent?=?require('superagent');
????var?cheerio?=?require('cheerio');
????var?request?=?require('request')?
????接下來就開始寫一下請求
app.get('/',?function?(req,?res,?next)?{
????superagent.get('你要輸入的網(wǎng)址')
????????.end(function?(err,?sres)?{
????????????if?(err)?{
????????????????return?next(err);
????????????}
? ? ? ? ? ? sres.text?里面存儲著網(wǎng)頁的?html?內(nèi)容,將它傳給?cheerio.load?之后
? ? ? ? ? ? 就可以得到一個實現(xiàn)了?jquery?接口的變量,我們習慣性地將它命名為?`$`
? ? ? ? ? ? 剩下就都是?jquery?的內(nèi)容了
????????????var?$?=?cheerio.load(sres.text);
????????????var?imgs?=?[];
????????????var?content?=?'';
????????????$('.pic').each(function?(index,?element)?{
????????????????let?temp?=?{
????????????????????'標題':?$(element).find('span').text()
????????????????}
????????????????content?+=?JSON.stringify(temp)?+?'\n';
????????????????console.log(content);
? ? ? ? ? ? ? ? 下面也是一樣查看頁面elemen結(jié)構(gòu)
????????????????if($(element).find('img').length?>?0){
????????????????????imgs.push($(element).find('img').attr('src'));
????????????????????console.log(imgs)
????????????????}
????????????});
????????????res.send(imgs);? //到locahost://3000查看
????????});
});
app.listen(3000,?function?()?{
????console.log('app?is?listenling?at?port?3000');
});