此原創(chuàng)文章已獲得大數(shù)據(jù)文摘(微信公眾號)采用,并于2017年4月29日發(fā)布(閱讀量近5K):前沿 | 國際可視化盛會PacificVis2017的十個精彩案例
上次翻譯的文章2016年10個重要的可視化發(fā)展中提到的可視化作品多數(shù)是新聞媒體領(lǐng)域的,這次筆者則將分享可視化學(xué)術(shù)界的一些前沿研究——來自剛結(jié)束的國際可視化盛會之一的IEEE PacificVis 2017的十個演講,涵蓋了城市數(shù)據(jù)可視化、科學(xué)可視化、圖可視化、高維數(shù)據(jù)可視化、人機交互(HCI)、AR/VR、數(shù)據(jù)敘事、可視分析等多個方面。
溫馨提示:文中提到的大量文章及案例,筆者都幫你整理好了,請移步文末附錄的傳送門~
以下排名不分先后:
1. 可視分析中的新方向
馬匡六教授,美國加利福尼亞大學(xué)戴維斯分校

馬教授是國際可視化與可視分析研究領(lǐng)域的著名學(xué)術(shù)帶頭人之一,作為本次大會中Pacific VAST研討會的第一位演講嘉賓,主要從極大規(guī)模(Extreme Scale)數(shù)據(jù)的數(shù)據(jù)分析、事件序列數(shù)據(jù)分析這兩個方面介紹了可視分析的研究新動向。第一個部分主要關(guān)注超大規(guī)模模擬所產(chǎn)生數(shù)據(jù)的可視分析,馬教授指出使用原位可視化(In Situ Visualization)是大勢所趨,應(yīng)用場景包括科學(xué)可視化、在線數(shù)據(jù)或流數(shù)據(jù)可視化等等。其中,數(shù)據(jù)聚集操作是一類重要的方法。通過對粒子或者場數(shù)據(jù)進行概率分布函數(shù)(Probability Distribution Functions)計算并離散化為一維或二維直方圖,模擬數(shù)據(jù)的信息能夠得到很大程度的保留,并且能支持縮放、修改劃分、修改直方圖槽數(shù)量、以及利用直方圖進行查詢和選擇等多種操作;把二維直方圖按時間順序堆疊起來還可生成3D體可視化進行時變屬性分析。
第二部分主要介紹了事件序列數(shù)據(jù)可視化的幾個案例,包括高性能計算中的性能、日志數(shù)據(jù)的可視化,如使用Behavioral Lines的云計算性能的可視分析,以及醫(yī)院燒傷病人日志數(shù)據(jù)的可視分析等等。馬教授還簡短地提到一個新的研究方向是保留隱私的可視化,具體可參考論文Privacy Preserving Visualization for Social Network Data with Ontology Information。
2. 城市數(shù)據(jù)的可視分析
巫英才教授,浙江大學(xué)

巫英才教授首先介紹了城市數(shù)據(jù)分析面臨的挑戰(zhàn),主要存在三個方面:(1)如何視覺提煉海量數(shù)據(jù);(2)如何將專家知識融入分析中并獲得見解;(3)如何將挖掘的知識有效的傳遞給用戶?;谶@些挑戰(zhàn),可視分析是非常重要的。相應(yīng)地,巫教授設(shè)立了多層次可視化、富交互多角度探索,以及通過故事敘事的形式表現(xiàn)分析結(jié)果這三個可視分析目標(biāo)。
隨后他介紹了在城市可視分析方面的兩個工作:SmartAdP 是一個利用出租車軌跡數(shù)據(jù),綜合車流量(車流量越大,越可能看到),車速(越慢越好),OD區(qū)域(潛在用戶的途徑路線),環(huán)境等多個因素,自動產(chǎn)生廣告牌的擺放的解決方案,并提供可視分析界面支持用戶進行探索和決策的工具,具體介紹可參考同名論文或北大的博文:用海量出租車軌跡數(shù)據(jù)選取廣告牌放置位置;Route-Zooming 則是一種通過道路變形將道路信息嵌入到地圖中的技術(shù),實現(xiàn)盡可能少變形的前提下,對地圖上的道路進行拓寬,然后將時空數(shù)據(jù)圖表內(nèi)嵌入道路中。
3. 眼動追蹤與可視分析
Daniel Weiskopf,德國斯圖加特大學(xué)

近年來,硬件技術(shù)的進步和眼動追蹤裝置成本的降低使得這種分析技術(shù)可以被大量的研究人員使用。Weiskopf 教授一方面指出了眼動追蹤技術(shù)在用戶研究中的作用,即幫助研究用戶是如何使用可視分析界面的。與傳統(tǒng)的計算準(zhǔn)確度和問卷調(diào)查等形式不同,該技術(shù)能有效捕捉用戶注意力的分布情況。另一方面,則介紹了如何通過可視分析技術(shù)來輔助對(大量)眼動追蹤數(shù)據(jù)的解讀。其中,常用的兩種分析方法包括Space-time cube軌跡顯示法以及Map display軌跡顯示法;而針對不同類型的眼動追蹤數(shù)據(jù),如關(guān)注區(qū)(AOI)、瀏覽軌跡(Scan Path)和聚焦點(Fixation)等,Weiskopf 教授也分別介紹了其分析方法。更多詳情請參考其論文:Visual Analytics Methodology for Eye Movement Studies。
最后,Weiskopf 教授總結(jié)道,以上兩種眼動追蹤可視分析結(jié)合起來,可以稱作是一種“Vis4Vis”方法——即“用于分析可視化作品的可視化(Visualization for visualization)”。這種可視化類別目前未得到明確定義和劃分,因此他希望學(xué)術(shù)界能夠更多地關(guān)注該方向的研究。
4. 用可視化進行數(shù)據(jù)敘事
Bongshin Lee,微軟

來自微軟研究所的Bongshin Lee博士由漢斯·羅斯林教授經(jīng)典的全球人口變化介紹等可視化案例引入,介紹了她在故事敘事(storytelling)方面自2012年以來的理論研究。在她的文章More than telling a story中,給出了對視覺數(shù)據(jù)故事(visual data story)的定義,概括出三大要素:數(shù)據(jù)驅(qū)動、視覺展示,以及故事片段之間的邏輯關(guān)系;而故事敘事的過程則由探索數(shù)據(jù),制造故事,和敘述故事這三個階段有機地組成。
另一方面,Lee博士具體介紹了其團隊開發(fā)的,幾款幫助故事敘事的創(chuàng)作工具:SketchStory 受白板動畫(Whiteboard Animation)展示方式的啟發(fā),提出一種使用觸控筆在電子板上描繪圖表的故事敘述方式,幫助提升聽眾的參與感;DataClips 是為非專業(yè)人士設(shè)計的數(shù)據(jù)視頻創(chuàng)作工具,通過對紐約時報等74個數(shù)據(jù)新聞視頻進行分析,建立數(shù)據(jù)新聞材料庫,相比傳統(tǒng)視頻制作軟件更易于上手,且能更靈活地修改數(shù)據(jù);Timeline Storyteller 是使用時間線為順序的敘事工具,利用了對200余款同類可視化的總結(jié)及從中提取的設(shè)計模式,可以在線嘗試。最后展望了未來的storytelling方向和挑戰(zhàn):包括如何融合故事的探索到展現(xiàn)的過程;如何評估數(shù)據(jù)驅(qū)動的故事和工具;數(shù)據(jù)故事的可讀性;新穎的、浸入式的交互體驗在storytelling的應(yīng)用。
5. 虛擬牽引器(Virtual Retractor)
Cheng Li,俄亥俄州立大學(xué)

來自俄亥俄州立大學(xué)的可視化小組提出了Virtual Retractor這種創(chuàng)新的交互式數(shù)據(jù)探索系統(tǒng), 在保證數(shù)據(jù)特征的基礎(chǔ)上對于可視化進行變形,從而解決科學(xué)可視化的3D空間中存在著遮擋的問題。該系統(tǒng)采用Retractor的隱喻,允許用戶像切割和分割實際物體一樣,直接操縱和探索數(shù)據(jù)。這個過程通過使帶有空隙的四面體網(wǎng)格(tetrahedral mesh)變形來模擬由切割產(chǎn)生的切口來進行。分割操作擴大了空隙,允許用戶觀察原來被遮擋的內(nèi)部結(jié)構(gòu)。其中,網(wǎng)格(mesh)的構(gòu)造考慮了局部數(shù)據(jù)屬性,如局部數(shù)據(jù)密度或梯度。因此,變形將受到所選數(shù)據(jù)屬性的影響。具有高數(shù)據(jù)屬性值的區(qū)域更加堅固,難以變形,而屬性值較低的區(qū)域?qū)冃?。從而,變形可以保持?jǐn)?shù)據(jù)中被感興趣的特征。
6. 可視分析改變世界
David Ebert,美國普渡大學(xué)

David Ebert教授是可視分析領(lǐng)域的專家,在包括安全、國防、社交媒體等等領(lǐng)域都有相關(guān)的可視分析工作。本次演講中,他首先總結(jié)了我們目前面臨的解全球性難題,如能源、可持續(xù)發(fā)展、潔凈水、人口資源等問題,并鼓勵學(xué)者進行基于應(yīng)用驅(qū)動的研究(Application-driven research),這樣能有效推動科學(xué)發(fā)現(xiàn)和改善世界,而且也有助于獲得研究資金和更多優(yōu)質(zhì)合作機遇。
在對可視分析進行釋義之后,他介紹了人機合作設(shè)計Human Computer Collaborated Design (HCCD),這種可以結(jié)合人類與計算機各自的優(yōu)勢、方便溝通,并有效地實現(xiàn)問題決策的方法;并舉了一系列關(guān)于利用社交媒體、安全、資源分布等等方面的例子(可參見他早前的報告)。他強調(diào),可視分析是輔助人、提升人的能力,而不是替代人的工作。最后,他還對最近興起的深度學(xué)習(xí)、風(fēng)險可視分析(Risk Visual Analytics)、因果可視分析(Causality Visual Analytics)以及VR/VA結(jié)合可視化等熱點話題進行了討論;并表示他對VR/VA在科學(xué)發(fā)現(xiàn)和決策分析領(lǐng)域的作用持觀望態(tài)度,但基于人們對這類技術(shù)的熱衷程度,他亦對此抱有期待。
7. 圖可視化的新評估方法
Seok-Hee Hong,悉尼大學(xué)

圖可視化主題在今年所接受論文、海報張貼中都有著很大的比例,而Hong教授在演講中介紹的忠實性(Faithfulness)指標(biāo)在此次大會中多次被其他演講者引用,可謂熱中之熱?,F(xiàn)有的圖布局評估方法,如基于邊交叉的方法,主要關(guān)注圖的可讀性;但隨著大數(shù)據(jù)時代的來臨,原有的評估方法是不夠的,因為包含大量數(shù)據(jù)的圖通常過于復(fù)雜,導(dǎo)致用戶難以直接通過感知邊的交叉來評估圖布局的優(yōu)劣。
于是,他們針對大圖提出了忠實性(Faithfulness)指標(biāo),它包括三大部分,Information faithfulness (圖布局對信息表現(xiàn)的忠實性), Task faithfulness (圖布局對任務(wù)的支持度)和Change faithfulness(圖布局對數(shù)據(jù)微變化的敏感度);同時提出了基于形狀的度量方法(Shape-based Metric)來計算Task faithfulness,且通過實驗證明了這種方法的有效性。有關(guān)對力導(dǎo)向圖和邊捆綁技術(shù)等現(xiàn)有可視化方法的忠實性(Faithfulness)評估,以及忠實性與可讀性的比較,請參考其論文:Towards Faithful Graph Visualizations。
8. Interaction+:“讓可視化動起來”
陸旻,北京大學(xué)

這個富有創(chuàng)意的工具早在2016年ChinaVis作為海報展出時就十分吸引人眼球,無需編程就能將網(wǎng)絡(luò)上現(xiàn)有的可視化作品變成動態(tài)可交互的,這對可視化設(shè)計師甚至工程師都是提高工作效率的福音。如今,這個工具不僅能自動識別已有的網(wǎng)頁可視化作品中的視覺圖元及屬性信息,然后對原可視化內(nèi)容進行過濾、聚集和重排,還能讓用戶能在原可視化的基礎(chǔ)上用輔助面板進行查詢、比較、打標(biāo)簽等交互。
其實現(xiàn)原理是通過解析網(wǎng)頁HTML文件物件模型 (DOM),并對SVG元素進行提取和操作,因此該工具適用于任何網(wǎng)頁上的SVG可視化作品,可以是程序員編寫的程序也可以是藝術(shù)家制作的信息圖。作者以紐約時報上的幾個可視化作品為例,對工具進行了精彩的演示,視頻詳見北大公眾號相關(guān)文章:“讓可視化動起來”的網(wǎng)頁交互工具Interaction+。
9. 基于Spark的大規(guī)模高維數(shù)據(jù)可視化
Jaemin Jo,首爾國立大學(xué)

來自首爾國立大學(xué)的Jaemin Jo首先分析了針對大規(guī)模數(shù)據(jù)的交互式探索的相關(guān)研究(見附錄)。常見的方法是使用數(shù)據(jù)立方體(data cube)等預(yù)處理數(shù)據(jù)結(jié)構(gòu),來總結(jié)數(shù)據(jù)并提供低延遲響應(yīng)。然而,由于查詢中涉及很多維度,這種方案會占用大量的內(nèi)存,且在查詢前必須由數(shù)據(jù)構(gòu)建特定數(shù)據(jù)結(jié)構(gòu)。他所在的團隊則利用亞馬遜EC2集群,并且基于Spark的流式處理方式,開發(fā)了適用于大規(guī)模高維數(shù)據(jù)可視分析的系統(tǒng)SwiftTuna。為了支持響應(yīng)查詢,SwiftTuna利用增量處理方法,立即提供低保真響應(yīng)(即快速響應(yīng))以及延遲的高保真響應(yīng)(即增量響應(yīng))。該系統(tǒng)支持對高達含有40億條記錄和40個維度的真實數(shù)據(jù)集的實時探索,且增量響應(yīng)的延時僅為幾秒鐘。具體實現(xiàn)詳見論文:SwiftTuna: Responsive and Incremental Visual Exploration of Large-scale Multidimensional Data。
10. 增強現(xiàn)實(AR)可視化
Gerard Jounghyun Kim,韓國高麗大學(xué)

隨著AR技術(shù)的興起,AR與可視化的結(jié)合也成為了可視化領(lǐng)域的新熱點。Gerard Jounghyun Kim教授主要從AR領(lǐng)域研究者的角度,分享了他對AR可視化的看法。Kim教授認(rèn)為AR可以被視為一種特殊的數(shù)據(jù)可視化,其數(shù)據(jù)不僅有現(xiàn)實數(shù)據(jù),還包括了增強物數(shù)據(jù);由于AR的特殊屬性,在實現(xiàn)有效的可視化時會面臨一些獨特的問題,對此Kim教授總結(jié)和提出了AR可視化的三個主要要求,即(1)自然度 - Naturalness,(2)可見度 - Visibility,(3)持久性/穩(wěn)定性 - persistance/stability。
自然度指的是增強物需要與用戶對真實世界的認(rèn)知模型保持一致,如正確的深度信息、相似的光照效果、合理的空間關(guān)系等等。可見度是指最大化信息的可見度,例如增強目標(biāo)物體的顯示、利用過濾法消除信息遮擋、平衡真實環(huán)境和增強物的關(guān)系等等。持久性和穩(wěn)定性是指增強物應(yīng)保持穩(wěn)定,且易于查看與交互。Kim教授以鋼琴樂譜增強現(xiàn)實可視化為例,指出用戶在演奏的時候同時關(guān)注鍵盤與樂譜,需要經(jīng)常轉(zhuǎn)移視線,容易造成疲倦。
最后,Kim教授談?wù)摿薃R可視化中一些待解決的問題以及相應(yīng)的發(fā)展方向,包括增強物的放置(如去除遮擋、決定尺寸位置)、三類要求衡量標(biāo)準(zhǔn)的制定,以及平衡增強物的自然性和可見性等等。
后記
以上內(nèi)容是對筆者在參加會議期間個人比較感興趣,或是比較新穎的一些主題的整理,限于篇幅還有很多精彩的演講沒有列舉,如果感興趣可以參考完整的會議項目。更多詳情也可參考北京大學(xué)可視分析公眾號的系列文章(詳見附錄:參考文獻),本文中一些對專有名詞及技術(shù)描述的翻譯參考了該系列文章,特此聲明和感謝。
由于會議內(nèi)容均以英文呈現(xiàn),且有許多筆者不太熟悉的領(lǐng)域和名詞,盡管筆者在寫作過程中參考了大量資料,仍可能存在疏漏或不準(zhǔn)確的地方,請多包涵,也歡迎批評指正。謝謝!
附贈實用鏈接
數(shù)據(jù)敘事實例及工具:
機器學(xué)習(xí)的視覺化介紹 | Kantar信息之美2015年獲獎作品,以懂得區(qū)別舊金山和紐約市房屋的模型為例,在網(wǎng)頁中將機器學(xué)習(xí)的基本過程一步步地用動態(tài)圖展現(xiàn),有(繁體)中文版。
統(tǒng)計的樂趣 | 漢斯·羅斯林 (Hans Rosling) 最出名的一次演講,在 4 分鐘內(nèi),用 12 萬個數(shù)據(jù)解釋 200 個國家 200 年的發(fā)展,有中英字幕。
新興的故事敘事技術(shù) | 頗值得一讀的綜述性英文論文,題目為 Emerging and Recurring Data-Driven Storytelling Techniques: Analysis of a Curated Collection of Recent Stories.
SketchInsight 和 SketchStory | 這個視頻展現(xiàn)了數(shù)據(jù)敘事中,兩種白板動畫型創(chuàng)作工具的結(jié)合使用:前者用于創(chuàng)作故事,后者用于展示故事。
以周計算的你的一生 (互動版), 阿拉伯之春時間線 | 兩個時間線可視化的實例,分別采用了分段布局和曲線布局。


時間線的重新審視 | 總結(jié)了263種時間線數(shù)據(jù)可視化,提出了有效進行時間線敘事的設(shè)計空間,包括來自表達,規(guī)模和布局這三個類別的14種設(shè)計方案,以及方案的20種組合方式。
大規(guī)模高維數(shù)據(jù)可視化:
imMens (2013) | 來自斯坦福大學(xué),針對大規(guī)模數(shù)據(jù)的實時可視化探索工具。開源[Github],具體實現(xiàn)參見論文[PDF]。
Nanocubes (2013) | 一個獲獎眾多,基于數(shù)據(jù)立方體(data cube),支持多維度、多粒度時空數(shù)據(jù)的實時聚合分析工具。開源[Github],提供API,具體實現(xiàn)參見論文[PDF]或北大相關(guān)博文。
Hashedcubes (2016) | 提出了比現(xiàn)有大規(guī)模數(shù)據(jù)實時視覺探索技術(shù)更高效、簡單的方法,開源[Github],左側(cè)鏈接為論文PDF。
Gaussian Cubes (2016) | 跟Hashedcubes一樣是來自亞利桑那大學(xué)的成果,在現(xiàn)有技術(shù)的基礎(chǔ)上增加了最小二乘法和主成分分析等模型的支持,左側(cè)鏈接為論文PDF。
原位可視化(In Situ Visualization):
大規(guī)模數(shù)據(jù)可視化 | 來自北京大學(xué)可視化與可視分析博客的主題介紹文章。
高性能計算與原位可視化 | 李思昆教授于2016年中國可視化大會上,對原位可視化(In Situ Visualization)技術(shù)及國內(nèi)高性能計算研究現(xiàn)狀的介紹。
參考文獻
- 北京大學(xué)可視分析公眾號系列文章:直擊 IEEE Pacific Visualization 2017 -
Day0, Day1, Day2, Day3. - Lu, Min, et al. "Interaction+: Interaction Enhancement for Web-based Visualizations." [PDF]
- Lee, Bongshin, Rubaiat Habib Kazi, and Greg Smith. "SketchStory: Telling more engaging stories with data through freeform sketching." IEEE Transactions on Visualization and Computer Graphics 19.12 (2013): 2416-2425.
- Lee, Bongshin, et al. "More than telling a story: Transforming data into visually shared stories." IEEE computer graphics and applications 35.5 (2015): 84-90.
- 胡華全, et al. "時變網(wǎng)絡(luò)可視化研究綜述." 系統(tǒng)仿真學(xué)報 25.9 (2013): 1975-1980.
- Zhang, Jiawei, et al. "A visual analytics framework for microblog data analysis at multiple scales of aggregation." Computer Graphics Forum. Vol. 35. No. 3. 2016.