首次于2016年舉辦的全球人工智能技術(shù)大會(huì),已發(fā)展成為中國(guó)人工智能技術(shù)和產(chǎn)業(yè)領(lǐng)域規(guī)模最大、影響力最強(qiáng)的年度盛會(huì)。2017年,匯聚了上百位全球人工智能學(xué)術(shù)界和產(chǎn)業(yè)界著名學(xué)者、頂級(jí)專家和業(yè)界精英。
2017年5月21日,由中國(guó)人工智能學(xué)會(huì)、中文信息學(xué)會(huì)主辦、億歐承辦的2017·全球人工智能技術(shù)大會(huì)在北京·國(guó)家會(huì)議中心拉開帷幕。





首次于2016年舉辦的全球人工智能技術(shù)大會(huì),已發(fā)展成為中國(guó)人工智能技術(shù)和產(chǎn)業(yè)領(lǐng)域規(guī)模最大、影響力最強(qiáng)的年度盛會(huì)。2017年,匯聚了上百位全球人工智能學(xué)術(shù)界和產(chǎn)業(yè)界著名學(xué)者、頂級(jí)專家和業(yè)界精英,以及上千位人工智能領(lǐng)域技術(shù)專家、創(chuàng)業(yè)者、投資家以及愛好者,在“交叉、融合、相生、共贏”的主旋律下,共同探討人工智能發(fā)展的科技創(chuàng)新與行業(yè)變革戰(zhàn)略,破解人工智能創(chuàng)業(yè)和商業(yè)模式的密碼。
本次大會(huì)主席由中國(guó)人工智能學(xué)會(huì)理事長(zhǎng)李德毅、IBM中國(guó)研究院院長(zhǎng)沈曉衛(wèi)擔(dān)任,嘉賓到場(chǎng)有美國(guó)微軟研究院技術(shù)院士黃學(xué)東、華為諾亞方舟實(shí)驗(yàn)室主任李航、聯(lián)想首席技術(shù)官兼高級(jí)副總裁芮勇、中科院沈陽自動(dòng)化所所長(zhǎng)于海斌等。
數(shù)據(jù)堂程蘭穎,在大會(huì)上針對(duì)智能駕駛領(lǐng)域做出主題演講:數(shù)據(jù)助力智能駕駛體驗(yàn)
以下是觀點(diǎn)提煉:
1、數(shù)據(jù)跟算法之間的關(guān)系,就像是教材與老師
2、未來的自動(dòng)駕駛和智能駕駛里也是需要達(dá)到高度的融合
以下是演講實(shí)錄
之前在人工智能領(lǐng)域,最為專注研究的是語音方面,從去年加入數(shù)據(jù)堂以來,專注于在數(shù)據(jù)這塊,數(shù)據(jù)和人工智能之間的關(guān)系,我想大家都很了解,也不言而喻,數(shù)據(jù)是一個(gè)非常重要的方面。我喜歡用一個(gè)比喻,數(shù)據(jù)跟算法之間的關(guān)系,如果數(shù)據(jù)是一個(gè)教材,那么算法就像是一位老師,老師用教材去教導(dǎo)你未來想要產(chǎn)生的人工智能任何一個(gè)應(yīng)用,比如說在今天的論壇上,智能駕駛,智能駕駛我們想讓它成為智能應(yīng)用的一個(gè)孩子。





我們先看一下智能駕駛,大家講了很多在自動(dòng)駕駛方面的事情,未來我想從另外一個(gè)角度,從純體驗(yàn)的角度,作為一個(gè)車的車主,在未來的幾年我們可以期望,我跟自己的車可以成為伙伴關(guān)系,我跟它之間需要有交互,而且這個(gè)交互可以是多模式的。
比如說我們講車的自動(dòng)駕駛,除了現(xiàn)在一般提到的5個(gè)不同的級(jí)別,未來我們希望能夠達(dá)到最高的級(jí)別,在第5個(gè)級(jí)別完全把我載到目的地。同時(shí)它需要在自動(dòng)層面做到自動(dòng)控制,就是我能自動(dòng)控制調(diào)節(jié)車內(nèi)的溫度,可以自動(dòng)控制車內(nèi)的娛樂設(shè)備,這是自動(dòng)控制方面的。
同時(shí),也需要有一些共享的方面,我的共享的信息,是車與車之間的,比如說前方的車碰到了交通事故,它把交通事故的信息分享給大家,車與車之間的信息分享,當(dāng)然車內(nèi)的乘客也可以有一個(gè)信息的分享。所以在這幾個(gè)方面呢,大家可以想象一下,未來你下了班,你告訴你的汽車五分鐘以后到大樓門口等我,進(jìn)了車以后,告訴車把我的座椅調(diào)整到60度,告訴它從最近的距離載我回家。
在這個(gè)過程中,汽車啟動(dòng)了,把你載回家,在車中收到了汽車中心控制器發(fā)生的信息,告訴你有一個(gè)緊急的郵件需要你簽字控制,你通過手工的簽字,然后語音控制發(fā)送它,發(fā)送給你的秘書,你回到座椅上繼續(xù)享受旅程?;丶衣飞?,你從中控中心收到這樣一個(gè)信息,告訴你前方有事故,同時(shí)給了你幾個(gè)選擇,可以繞開事故現(xiàn)場(chǎng),這個(gè)狀態(tài)下你跟你的車有一個(gè)交互,而不是你希望從某一條路線繞過這個(gè)交通事故,你告訴你的車從這里繞過。在整體的體驗(yàn)下,我們期望我們的車未來自動(dòng)做一些事情,能夠真的成為你的伙伴。
為了達(dá)到這個(gè)愿景,很多嘉賓和在座的各位,都在做不懈的努力,剛才有嘉賓分享了硬件方面和軟件方面的東西,這些事情在未來的自動(dòng)駕駛和智能駕駛里也是需要達(dá)到高度的融合,比如有不同的傳感器,有聲音傳感器,有照相機(jī),還有雷達(dá)顯示器,和GPS,它們得到的信息通過控制器進(jìn)入中央處理器,中央處理器通過識(shí)別和算法,得到最終的判斷結(jié)果,當(dāng)然它需要進(jìn)入到你的不同的終端,比如說我要聽音樂,你告訴它播放劉德華的音樂,它就需要從音樂控制終端播放音樂,從最近的距離回家,自動(dòng)駕駛需要執(zhí)行這個(gè)命令。在整個(gè)過程中,雖然還有很長(zhǎng)的路可走,但是未來整個(gè)技術(shù)的發(fā)展和融合是不可避免的。





在這個(gè)過程中,數(shù)據(jù)也是很重要的一個(gè)方面,我們?cè)跀?shù)據(jù)堂有幸對(duì)智能駕駛領(lǐng)域做了一些關(guān)于數(shù)據(jù)方面的嘗試,形成了一系列的數(shù)據(jù)集,服務(wù)于剛才我提到的各個(gè)算法,各個(gè)不同的智能算法,這些數(shù)據(jù)集包括用于剛才我說到的交互的數(shù)據(jù)集,比如說語音交互,文字交互,手勢(shì)交互,我們有一類是稱之為交互的數(shù)據(jù)。另外一類就是自動(dòng)駕駛類的數(shù)據(jù)集,不言而喻,剛才很多嘉賓都提到了自動(dòng)駕駛,大家都在做軟件硬件和算法,為了滿足大家對(duì)于各種不同駕駛算法的需求,我們?cè)谧詣?dòng)駕駛數(shù)據(jù)集里做了不同層面的標(biāo)的,給大家一些數(shù)據(jù)集。
首先給大家介紹一下交互方面的數(shù)據(jù)集,我們有兩方面的東西,一個(gè)就是基礎(chǔ)數(shù)據(jù),基礎(chǔ)數(shù)據(jù)的變化在于說,我們有很多不同語言,包含很多不同語言,包括國(guó)內(nèi)的普通話和方言,去年大家很關(guān)注上海話,上海話最近方言領(lǐng)域里比較常用的交互語言,同時(shí)有歐洲語系和亞洲語系的其他語言。年齡是分為成年和青少年,年齡涵蓋是從3歲到了70歲的年齡,作為一個(gè)基礎(chǔ)數(shù)據(jù)集大也知道它的口音覆蓋非常重要,所以對(duì)于我們來說,我們?cè)跀?shù)據(jù)集的生產(chǎn)過程中,任何一種語言都會(huì)涵蓋語言的各個(gè)不同的區(qū)域,作為基礎(chǔ)數(shù)據(jù)集,它的內(nèi)容是通用的內(nèi)容,包括一些體育、娛樂、商務(wù),當(dāng)然也包括我們?cè)谡Z音交互過程中常用的東西。
大家對(duì)比一下基礎(chǔ)數(shù)據(jù)和車載數(shù)據(jù),車載數(shù)據(jù)是我們專門為車載環(huán)境采集的數(shù)據(jù),它在場(chǎng)景和內(nèi)容上就有一些不同,內(nèi)容我們可以看到,在這個(gè)數(shù)據(jù)集里,內(nèi)容除了通用的語料之外,還會(huì)加入控制命令,一些地址,一些音樂方面的內(nèi)容,這個(gè)是針對(duì)車內(nèi)的應(yīng)用場(chǎng)景而做的一些變化。
同時(shí),在場(chǎng)景方面,車在不同的駕駛環(huán)境下,在不同的路況下,比如車速、車窗我們都有一些考慮。對(duì)于車載數(shù)據(jù)和基礎(chǔ)數(shù)據(jù)集,我們做了一個(gè)簡(jiǎn)單的算法,做算法的研究者,他研究算法的提高,通常他們做的測(cè)試是基于這個(gè)測(cè)試集,在這個(gè)算法下面的算法改進(jìn),能夠讓我的效果改進(jìn)多少,對(duì)于我們做數(shù)據(jù)的,我們做的是在不同的數(shù)據(jù)集下面,基于同樣的算法,我的效果能夠提升多少,我們有做過一些基礎(chǔ)的測(cè)試,對(duì)于車載的測(cè)試,在車載環(huán)境下基于同一算法,我們有10%到30%的提升。這是語音交互方面的。
另外,從我們分享的愿景來看,我們?cè)谲嚴(yán)镉锌赡苡玫轿淖?,目前有中英文?chǎng)景文字輸入,這是我給大家的樣例,在不同的場(chǎng)景下,比如火車站、公園、圖書館、馬路、室內(nèi),不同場(chǎng)景下實(shí)拍的一些照片。下面我沒有寫相干這類的文字交互我們還要做手寫體,因?yàn)楝F(xiàn)在在車?yán)铮蠹胰ゴ蜃诌@個(gè)事情很難實(shí)現(xiàn),所以下一步會(huì)做手寫體的數(shù)據(jù)。
回到我今天重點(diǎn)跟大家介紹的自動(dòng)駕駛的數(shù)據(jù),這個(gè)數(shù)據(jù)是我們今年剛剛生產(chǎn)的,目前第一期已經(jīng)做完了,下半年還有計(jì)劃做第二期。這套數(shù)據(jù)它的硬件,它實(shí)際上是相機(jī)拍攝的圖片,我們有兩種相機(jī),這兩種相機(jī)具體的規(guī)范我不跟大家一一念了,雖然在設(shè)備上有小小的不同,但是基本上這兩個(gè)相機(jī)功能差不多,我們拍攝的時(shí)候,它安裝的位置是前車窗上端的中心位置。采集范圍,大家知道業(yè)內(nèi)有一些比較開放的數(shù)據(jù)集,最近(英文)也有數(shù)據(jù)集出來,我們這個(gè)數(shù)據(jù)集它的采集范圍是在全國(guó)范圍內(nèi),就是中國(guó)全國(guó)范圍內(nèi)不同道路的路況,下面我會(huì)跟大家介紹一下對(duì)于道路類型分類的狀況。采集的時(shí)間是從早上8點(diǎn)到下午6、7點(diǎn),有一些知道光線也是有變化的。
就采集地點(diǎn)的細(xì)節(jié),我們說是全國(guó),但是我們就采集規(guī)范的細(xì)節(jié)做了一些分類,對(duì)比較有特點(diǎn)的路段,進(jìn)行一些特別的關(guān)注,比如在城區(qū)的德國(guó),有交通標(biāo)識(shí)的地區(qū)我們要進(jìn)行采集,然后就是轉(zhuǎn)彎的地方,還有十字路口,有交通等燈的地方,還有隧道里比較暗的地方。從采集地點(diǎn)來講,我們對(duì)這幾個(gè)地點(diǎn)有一些特別的標(biāo)定。
物體分布,針對(duì)剛才所說的幾個(gè)不同的采集地點(diǎn),物體的分布是有不同的,大家可以看到,比如在城市、城區(qū)、行人、車輛很多,隧道里幾乎沒有什么行人,其他地方可以看到,有一個(gè)特點(diǎn),我們選擇的路段,或者說我們選擇做標(biāo)定的圖片,車輛是比較多的,因?yàn)榇蠹易鏊惴ǖ臅r(shí)候,一個(gè)很重要的目標(biāo),就是要檢測(cè)到前方的車,所以對(duì)象我們選擇的這些做過標(biāo)定的路段,對(duì)于車輛的數(shù)目還是不少的,因?yàn)槲覀冊(cè)谂臄z的過程中,雖然有很多的原始的圖片,但是在標(biāo)定的圖片,我們做過一些選擇的。
標(biāo)注的類型,配合大家做算法的方式,標(biāo)注的類型也有幾個(gè)不同的方法,一個(gè)就是標(biāo)Bounding Box,這個(gè)是原圖片,這個(gè)是標(biāo)注過以后的圖片,除了標(biāo)注框以外,我們對(duì)它的屬性也做了標(biāo)定。另外一個(gè)標(biāo)定方法就是Fine Annotation,這是像素級(jí)的標(biāo)定,我們有兩種不同的標(biāo)定,一個(gè)是針對(duì)道路線和道路上的指示標(biāo)識(shí)做的標(biāo)定,另外一個(gè)就是對(duì)全景,包括天空,周圍的樹木和建筑做的標(biāo)定。
這是我們標(biāo)定的內(nèi)容,現(xiàn)在加起來應(yīng)該有76類,是目前標(biāo)定數(shù)據(jù)集里比較全的數(shù)據(jù)集,行人類就標(biāo)定了4種,一種是普通的行人,然后是騎自行車的,然后騎電動(dòng)車或摩托車,還有坐著的。車也是7種類型的車,包括方向,遮擋屬性,截?cái)鄬傩?,這里都有一些詳細(xì)的定義,我不跟大家一一念了,大家如果有細(xì)節(jié)的需求,可以下來聯(lián)絡(luò)我。
我們或?qū)π盘?hào)燈和指示標(biāo)志類也做了標(biāo)注,信號(hào)燈做了10類,指示標(biāo)志類30類,包括所有常見的指示標(biāo)識(shí)。后面還有標(biāo)的另外一大類,就是禁行標(biāo)識(shí),包括禁止通行,禁止左轉(zhuǎn)等方面的一些禁行標(biāo)識(shí)類的標(biāo)注,前面幾個(gè)類型包括紅綠燈標(biāo)識(shí)和禁行標(biāo)識(shí),人和車,這是用Bounding Box標(biāo)定的。





下面看一下Fine Annotation,F(xiàn)ine Annotation增加了路面標(biāo)識(shí),就是道路線的標(biāo)識(shí),就是路面所有的道路線和指示標(biāo)識(shí)的Fine Annotation。對(duì)于道路上的東西,我們標(biāo)注了這樣幾類,一個(gè)是路面的指示標(biāo)識(shí),還有道路線,還有路面上的限速標(biāo)志,還有道路的邊界線,這幾類是我們?cè)贔ine Annotation對(duì)于道路標(biāo)注的方法。比如在劃框類標(biāo)識(shí)的人和車也都做了標(biāo)注,我們還增加了這幾類,全景類標(biāo)注,指一張圖片里,把所有的物體都做標(biāo)識(shí),所以增加了一些平地,比如路面和人行道,不屬于我們標(biāo)注的范圍內(nèi),我們也把它在全景類標(biāo)注里標(biāo)定出來了,還有一些物體,包括電線桿東西,路邊的建筑,天空,云,等于一張圖片里所有物體都進(jìn)行了標(biāo)注,這是全景類標(biāo)注的方法。
