創(chuàng)作初心
與2003年SARS相比,我們的科技水平已經有了較大的提高。通過科技技手段的運用,特別是充分挖掘手機信令的數據價值,可以更有針對性地解決防控疫情問題。
從技術上角度上說,利用手機信令數據完全可以對一個地區(qū)甚至更大空間范圍內的人口流動,進行詳細地數據搜集。近些年一些城市在舉辦大型活動、人口調查,旅游人口,傳染病傳播流向與的分析上,都采用了以手機信令為核心數據源的分析和洞察?;谑謾C信令的數據分析,為提高大型活動的安全治理,人口空間的分布情況以及重點區(qū)域的管理都提供了重要的科學和數據保障
本方案基于脫敏的信令數據,并以華南海鮮批發(fā)市場為例,實現包括疫情傳染源的整體分析; 疑似人群活動區(qū)域識別;疫情態(tài)勢溯源與推演。
傳染源整體分析
隨著海鮮市場逐步停業(yè)整頓,自一月起流動人口有了明顯的下降,1月10日之后幾乎不再出現流動人口
華南海鮮批發(fā)市場被認為初期新冠病毒進行二次傳播的高發(fā)區(qū)。我們基于信令數據,對華南海鮮市場周邊的人口流動據做挖掘;找出華南海鮮批發(fā)市場人流變化與新冠早起趨勢發(fā)展的潛在聯系。
如圖所示為十二月至一月底人口流動趨勢的按日統(tǒng)計圖,可以發(fā)現自一月份以來,隨著華南海鮮市場的關停和疫情的升溫,人流趨勢明顯下降。

我們將時間區(qū)間細化到小時,如圖所示為華南海鮮批發(fā)市場十二月至一月底每小時人員駐留行為變動情況;工作日的人流波動高峰出現在上午11點前后與晚上19點前后(近午餐、晚餐)。而周末總體趨勢比較平緩

同時我們將相關華南海鮮市場相關新聞標注到了坐標軸上,可以更方便看到”黑天鵝“”對華南海鮮市場人流趨勢的營銷。 自12月15日起,開始陸續(xù)出現發(fā)生有華南海鮮市場接觸史的患者, 而自1月起,海鮮市場逐步停業(yè)整頓,流動人口有了明顯的下降

華南海鮮市場傳播趨勢溯源
我們基于重構的Word2Vec&Doc2Vec實現了華南海鮮周邊用戶移動模式挖掘,發(fā)現華南海鮮批發(fā)市場80%以上的人群,都來自于5公里范圍內的區(qū)域,我們建議對5公里內地區(qū)的范圍做重點排查,對超過5公里的特定區(qū)域做選擇性排查
在探索了華南海鮮市場整體趨勢變化的基礎上,我們希望實現流入華南海鮮市場的用戶群識別體,為新冠溯源提供數據基礎。
軌跡移動模式挖掘
下面,我們將以挖掘武漢市民的移動模式為基礎,實現對遷入與遷出華南海鮮市場群體的識別;我們通過對武漢市手機用戶途徑基站的時間序列數據, 以及每個基站的地理坐標信息編碼,形成用戶軌跡編碼;同時原數據中的時間帶有時分秒等信息, 為了保證每個位置具有較高的出現頻率, 將時間信息聚合至每個小時整點。格式如下:
{ }
w為脫敏的用戶標識,s為位置信息,t為每個小時點。基于Word2Vec 模型進行訓練[1], 將得到每條位置點的向量化標識與相似度;基于Doc2vec對用戶軌跡整體編碼訓練后,將得到用戶軌跡間的相似度。整體方案如下圖所示:

其中,我們采用用cosine距離來計算坐標與坐標,軌跡與軌跡的相似度:
如圖所示為Word2Vec/Doc2Vec 模型進行訓練后用tensorborad對時空向量與軌跡向量的投影層(Projection Layer)做投射,如下圖所示:

為更好進行時間與空間的推演,我們對經典的Word2vec和Doc2vec進行了重構,
在傳統(tǒng)的Word2vec模型中,把每個時空點當做為類別標簽,丟失了其數值的屬性和信息。我們希望在Word2vec訓練模型時,加入時間與空間的數值判斷和比較,方便我們做時間與空間的推演[2]
我們只選取大于一定范圍的時空坐標點放到滑動窗口中構建訓練訓練集,訓練結束后,逐一將每個時空向量的相似度在top5的范圍內的時空坐標點相連接,并投射至武漢地圖平面,如下圖所示:

傳播溯源
接下來,我們分別按照空間與時間推演的方式,來看華南海鮮周邊的用戶流入情況,為新冠早期的傳播溯源提供支持。
我們 將華南海鮮批發(fā)市場 作為終點,來看之前的一段時間內遷入情況,嘗試發(fā)現新冠病毒最有可能是在哪些位置被帶入華南海鮮批發(fā)市場 的,如圖所示內圈為1公里范圍,外圈為5公里范圍:

我們發(fā)現華南海鮮批發(fā)市場80%以上的人群,都來自于5公里范圍內的區(qū)域——因此我們建議對5公里內地區(qū)的范圍做重點排查,對超過5公里的特定區(qū)域做選擇性排查。
傳播推演
基于上文提到對武漢市民移動模式挖掘的基礎上,我們希望按照時間與空間的維度,挖掘出在華南海鮮市場發(fā)生過密切接觸后的用戶之后的去向,并從而對這些區(qū)域做重點防控
空間推演
空間維度上,漢口火車站,范湖地鐵站,萬達廣場等都是華南海鮮市場人流遷徙的重點目標,省內的孝感,黃岡,黃石等,省際貴陽,洛陽,??冢暇?/strong>都是華南海鮮市場人群流向的重點城市。
我們將觀察人群的流出情況,與華南海鮮市場存在高度相似的時空坐標點如下圖所示,華南海鮮市場的西南方向包括道路和漢口火車站,因此,時空坐標點的方向的趨勢更加明顯。

我們限定與華南海鮮市場的距離超過300米,且具備強相關的位置,并標識poi信息,如圖所示:

漢口火車站,范湖地鐵站,萬達廣場等都是華南海鮮市場人流遷徙的重點目標。
我們接下來預測最有可能從華南海鮮市場出發(fā),去往其他城市的軌跡,如圖所示為與華南海鮮市場具備較強相關度的外部省市, 省內包括孝感,黃岡,黃石等,省際包括貴陽,洛陽,???,南京 。

時間推演
時間維度上,大部分在華南海鮮市場周邊人群將在4-12小時之內離開并擴散;而武漢市內的武昌區(qū),洪山區(qū),江夏區(qū)等位于長江以南的位置,在12個小時內受影響相對較??;新冠攜帶者極有可能在12小時之內擴散到武漢市外的其他省市區(qū)域,
下面我們忽略空間維度,來觀測隨著時間t的推移,與華南海鮮市場具備較強時空相似度的區(qū)域s的強度及分布變化情況。如圖所示為12個小時內時空點相關度變化,區(qū)域顏色越深標識相關度越強:

可以看到隨時間的推移,華南海鮮市場周邊區(qū)域的相似度逐步變弱——大部分在華南海鮮市場主要的用戶群在4-12小時之內離開并擴散
如圖所示為12個小時內,時空點相關范圍的變化:

可以看出隨時間推移,高相似度區(qū)域逐步擴散,特別是臨近的機場,高速武漢周邊衛(wèi)星城逐步出現高相似度時空坐標。由此可見,武漢市內的武昌區(qū),洪山區(qū),江夏區(qū)等位于長江以南的位置,在12個小時內受影響相對較小;而在海鮮市場的被感染的新冠攜帶者極有可能在12小時之內擴散到武漢市外的其他省市區(qū)域
防控應用
除華南海鮮市場外,我們也在結合衛(wèi)健委公開的確診、疑似病例數據,計算出這些用戶的移動模式,傳播趨勢。同時分析風險值較高區(qū)域,實現對城市、縣域、街道、社區(qū)的風險預警,如圖所示為我們以某個小區(qū)為例,通過對該位置用戶移動的模式計算得到人口密度與人口流動情況:

進一步我們還可以基于該位置用戶移動的模式,提供該小區(qū)的復工狀況,人均在外時長等信息:

此外,我們也在通過信令數大據面向公眾用戶提供健康碼服務, 密切接觸者查詢;向政府部委提供行業(yè)復工指數等服務。在解決用戶實際需求的同時,為政府部委提供科學精準的數據支撐和分析服務。后續(xù)我們將加持續(xù)信令大數據能力建設,進一步發(fā)揮信令大數據在疫情防控的價值。
-
location2vec
: a situation-aware representation for visual exploration of urban locations. ?