疫情地圖 | 你知道是如何產(chǎn)生的嗎?

圖源自 新華視點

從2019年底至今國內(nèi)遭受新冠病毒侵襲,舉國上下同心共戰(zhàn)“疫”!大家也都注意到了,除國家每天都會公布疫情最新數(shù)據(jù)外,各大互聯(lián)網(wǎng)公司也都發(fā)布了“疫情地圖”,支付寶首頁、微信的“醫(yī)療健康”、百度首頁等等每天都會更新“疫情數(shù)據(jù)”,讓大家能夠更加清晰直觀地了解疫情狀況。那么這個“疫情地圖”是如何產(chǎn)生的,你知道嗎?今天我就簡要和大家介紹下整個技術(shù)流程。

圖源自 百度疫情實時大數(shù)據(jù)報告

數(shù)據(jù)來源

國家衛(wèi)健委、各地方衛(wèi)健委每天會在其官網(wǎng)公布最新疫情數(shù)據(jù),這是最權(quán)威的數(shù)據(jù)來源,無論是支付寶、微信、百度的疫情地圖旁邊都能找到類似 數(shù)據(jù)來源:根據(jù)國家衛(wèi)健委、各省市區(qū)政府衛(wèi)健委。。等字樣,衛(wèi)健委公布的數(shù)據(jù)就是他們的數(shù)據(jù)來源。

數(shù)據(jù)采集

國家衛(wèi)健委疫情數(shù)據(jù)公布

上圖是國家衛(wèi)健委公布的截至2月25日的疫情情況。想象一下如何在Excel去制作一個柱狀圖或者餅圖,直接把這些文字拷進Excel里是沒有辦法生成一個圖表的。同樣的,制作“疫情地圖”也需要類似下圖的結(jié)構(gòu)化數(shù)據(jù)(當然實際這些數(shù)據(jù)是存儲到數(shù)據(jù)庫的)。

結(jié)構(gòu)化數(shù)據(jù)示意

那么如何去各個衛(wèi)健委網(wǎng)站整理這些數(shù)據(jù)呢?最笨最耗時的辦法當然就是人工每天去瀏覽每個網(wǎng)站,自己整理出這樣的數(shù)據(jù)。顯然這樣做耗時耗力又容易出錯。實際應(yīng)該是通過 網(wǎng)絡(luò)爬蟲,讓程序每天自動的去抓取各網(wǎng)站數(shù)據(jù),然后自動整理,自動寫入數(shù)據(jù)庫。這就需要程序員去寫這個爬蟲的程序去實現(xiàn)這些功能。

數(shù)據(jù)展示

好了,現(xiàn)在已經(jīng)有了結(jié)構(gòu)化的數(shù)據(jù),并且已經(jīng)存入了數(shù)據(jù)庫。接下里就是如何制作上述提到的數(shù)據(jù)地圖了。實際上已經(jīng)有很多成熟的前端框架(例如百度的Echarts,高德地圖,等等
),只要把數(shù)據(jù)按要求“灌入”這些框架中,自然就能呈現(xiàn)出各種效果了。當然這個過程需要寫后端代碼去獲取數(shù)據(jù)庫里數(shù)據(jù)返給前臺,前端拿到數(shù)據(jù)后也需要寫相應(yīng)代碼去實現(xiàn)這些功能。

圖源自 支付寶疫情實時跟蹤
圖源自 支付寶疫情實時跟蹤

圖片源自網(wǎng)絡(luò),侵權(quán)必刪!

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

友情鏈接更多精彩內(nèi)容