1.我采集的是新浪博客的頁面 新浪博客/s/articlelist_1765896480_0_1.html 新浪博客換成blog.sina.com.cn 方便演示。
2.在欄目選擇你要采集的欄目


在博客分頁列表要注意頁面數(shù)據(jù)的變化要選擇你需要采集的頁面

3.然后就是要采集他的頁面鏈接了

<div?id="sina_keyword_ad_area2"?class="articalContent???newfont_family">
[!--newstext--]
</div>

4.然后就是正文標題和文章內容了

<title>[!--title--]</title>

<div?id="sina_keyword_ad_area2"?class="articalContent???newfont_family">
[!--newstext--]
</div>
5.接下來就測試文章是否采集成功了
在采集審核中查看如果是空白說明采集失敗,從我說的上面幾點開始檢查


