
從2019年底至今國內(nèi)遭受新冠病毒侵襲,舉國上下同心共戰(zhàn)“疫”!大家也都注意到了,除國家每天都會公布疫情最新數(shù)據(jù)外,各大互聯(lián)網(wǎng)公司也都發(fā)布了“疫情地圖”,支付寶首頁、微信的“醫(yī)療健康”、百度首頁等等每天都會更新“疫情數(shù)據(jù)”,讓大家能夠更加清晰直觀地了解疫情狀況。那么這個“疫情地圖”是如何產(chǎn)生的,你知道嗎?今天我就簡要和大家介紹下整個技術(shù)流程。

數(shù)據(jù)來源
國家衛(wèi)健委、各地方衛(wèi)健委每天會在其官網(wǎng)公布最新疫情數(shù)據(jù),這是最權(quán)威的數(shù)據(jù)來源,無論是支付寶、微信、百度的疫情地圖旁邊都能找到類似 數(shù)據(jù)來源:根據(jù)國家衛(wèi)健委、各省市區(qū)政府衛(wèi)健委。。等字樣,衛(wèi)健委公布的數(shù)據(jù)就是他們的數(shù)據(jù)來源。
數(shù)據(jù)采集

上圖是國家衛(wèi)健委公布的截至2月25日的疫情情況。想象一下如何在Excel去制作一個柱狀圖或者餅圖,直接把這些文字拷進Excel里是沒有辦法生成一個圖表的。同樣的,制作“疫情地圖”也需要類似下圖的結(jié)構(gòu)化數(shù)據(jù)(當然實際這些數(shù)據(jù)是存儲到數(shù)據(jù)庫的)。

那么如何去各個衛(wèi)健委網(wǎng)站整理這些數(shù)據(jù)呢?最笨最耗時的辦法當然就是人工每天去瀏覽每個網(wǎng)站,自己整理出這樣的數(shù)據(jù)。顯然這樣做耗時耗力又容易出錯。實際應(yīng)該是通過 網(wǎng)絡(luò)爬蟲,讓程序每天自動的去抓取各網(wǎng)站數(shù)據(jù),然后自動整理,自動寫入數(shù)據(jù)庫。這就需要程序員去寫這個爬蟲的程序去實現(xiàn)這些功能。
數(shù)據(jù)展示
好了,現(xiàn)在已經(jīng)有了結(jié)構(gòu)化的數(shù)據(jù),并且已經(jīng)存入了數(shù)據(jù)庫。接下里就是如何制作上述提到的數(shù)據(jù)地圖了。實際上已經(jīng)有很多成熟的前端框架(例如百度的Echarts,高德地圖,等等
),只要把數(shù)據(jù)按要求“灌入”這些框架中,自然就能呈現(xiàn)出各種效果了。當然這個過程需要寫后端代碼去獲取數(shù)據(jù)庫里數(shù)據(jù)返給前臺,前端拿到數(shù)據(jù)后也需要寫相應(yīng)代碼去實現(xiàn)這些功能。


圖片源自網(wǎng)絡(luò),侵權(quán)必刪!