無標題文章

摘要

學(xué)Python不拿來寫爬蟲,總能對得起這門具有強大爬蟲功能的腳本語言呢。
現(xiàn)在就來講講如何利用網(wǎng)頁爬蟲來寫一個天氣預(yù)報采集器,主要就是在中國天氣網(wǎng)上爬取網(wǎng)頁并過濾數(shù)據(jù),得到需要的天氣信息并打印出來。
這個爬蟲例子實現(xiàn)的功能不僅可以查全國城市的天氣情況,也可以查一個省份或直轄市的總體天氣情況,如輸入“廣東”則會列出廣東省內(nèi)所有地方的天氣。
Python版本:2.7
系統(tǒng)平臺:ubuntu 14.04

編程思想

http://www.weather.com.cn/data/cityinfo/%s.html 這個中國天氣網(wǎng)的鏈接即可顯示對應(yīng)城市的天氣,其中%s是城市編碼,如北京的城市編碼是101010100,則瀏覽器地址欄輸入http://www.weather.com.cn/data/cityinfo/101010100.html 即可顯示北京的天氣信息。這樣就可以生成城市和城市編碼的字典,輸入城市轉(zhuǎn)化為編碼,并嵌入到上述鏈接中,過濾得到相應(yīng)的信息并打印出來。
那么,列出一個省份中所有城市的天氣怎么實現(xiàn)呢?也很簡單,我注意到一個省份的所有城鎮(zhèn)的城市編碼前5位都是一樣的,如廣東省的廣州啊,深圳啊,東莞啊等等這些城市的編碼前5位都是10128,因此可以生成省份和5位省份編碼的字典,輸入省份轉(zhuǎn)化為編碼,再加上剩余的4位并嵌入到上述鏈接中,過濾得到相應(yīng)的信息并打印出來。
編程思想有了,敲代碼就簡單了,我自己實現(xiàn)的代碼如下:
代碼里city和provincce都是一個字典文件,字典的key是城市名稱,value是城市編碼。運行程序的效果如下:

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • EXCEL小白的進階之路 從16年3月申請的小號,到現(xiàn)在發(fā)表的微文,屈指可數(shù),糾結(jié)于想要好的內(nèi)容,好的頁面排版,然...
    Rachelhaha閱讀 1,476評論 0 0
  • 轉(zhuǎn)至元數(shù)據(jù)結(jié)尾創(chuàng)建: 董瀟偉,最新修改于: 十二月 23, 2016 轉(zhuǎn)至元數(shù)據(jù)起始第一章:isa和Class一....
    40c0490e5268閱讀 2,072評論 0 9
  • 生活,他媽什么鬼,都去死吧!!!
    泥葉閱讀 152評論 0 0
  • 很開心能夠被評為大頭早起成長營第三期的優(yōu)秀學(xué)員,并代表讀書組做分享。 雖然一開始確實有向著優(yōu)秀學(xué)員努力的想法;可是...
    mydjohnson閱讀 955評論 3 49
  • 說起中國古代的美女,大家首先想到的是‘’四大美女‘’王昭君、西施、貂蟬、楊玉環(huán)。由于無圖無真相(不過現(xiàn)在的照片由于...
    水中沚閱讀 2,624評論 38 42

友情鏈接更多精彩內(nèi)容