c# 爬蟲

準備第三方插件

HtmlAgilityPack 在nuget中可以找到并下載 然后在項目中引用

代碼步驟

從指定網(wǎng)站把網(wǎng)頁的html獲得
WebRequest request = WebRequest.Create("http://www.hnzbcg.com.cn/hnzbcg/cgxx/cggg/A080302index_1.htm"); WebResponse response = request.GetResponse(); StreamReader reader = new StreamReader(response.GetResponseStream(), Encoding.GetEncoding("gb2312")); string s = reader.ReadToEnd();
將獲得的html字符串傳入 這個插件的具體使用可以參考http://www.cnblogs.com/GmrBrian/p/6201237.html
HtmlDocument doc = new HtmlDocument(); doc.LoadHtml(s); HtmlNode div = doc.DocumentNode.SelectSingleNode("http://a[@class='GrayLink12']"); HtmlNodeCollection hrefList = doc.DocumentNode.SelectNodes("http://a[@class='GrayLink12']"); List<string> list = new List<string>();

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

友情鏈接更多精彩內容