姓名:馬行健
學(xué)號:16020199036
轉(zhuǎn)載自:https://www.zhihu.com/question/268155924/answer/499947722
問題導(dǎo)讀:無人駕駛技術(shù)有什么難點(diǎn)?有什么解決方法?
無人駕駛最大的難點(diǎn),也是最重要的要素,就是安全。
高安全性意味著低事故率。一個(gè)系統(tǒng)做到很低的事故率,通常要做兩件事情,一個(gè)是發(fā)現(xiàn)問題,一個(gè)是解決問題。
開始時(shí),由于系統(tǒng)的問題非常多,主要精力在解決問題,但是隨著事故率逐漸降低,發(fā)現(xiàn)問題變得越來越難。據(jù)統(tǒng)計(jì),全球來看,對于人類司機(jī),一億公里發(fā)生致命事故1~3起。對于無人駕駛,我們希望比人更安全,最好致命事故率低一個(gè)量級,做到十億公里一起致命性事故。統(tǒng)計(jì)上,要達(dá)到足夠置信度,需要多次重復(fù)實(shí)驗(yàn),最好一百次以上。這意味著一套比人更加安全的無人駕駛的系統(tǒng)需要測試的總里程達(dá)到1000億公里。按照一輛車一年10萬公里總里程計(jì)算。我們需要100萬輛車,一整年的時(shí)間,收集無人駕駛數(shù)據(jù)和測試,才能夠保證無人駕駛所需的安全性?,F(xiàn)在Google和百度的無人車成本都在百萬人民幣量級,乘以100萬輛車這個(gè)巨大的基數(shù),對于任何一家公司而言,都是一個(gè)天文數(shù)字。
如何克服?
無人車大規(guī)模數(shù)據(jù)收集和測試的巨大成本主要來源于兩方面:一方面是需要海量的測試車輛,另一方面是高昂的單車成本。
針對這兩方面的成本,我們有兩種互補(bǔ)的解決方案:第一種解決方案是無人駕駛模擬;第二種解決方案是眾包數(shù)據(jù)收集和測試。
無人駕駛模擬可以通過算法生成感知和決策數(shù)據(jù),減少數(shù)據(jù)收集和測試車輛數(shù)量,降低研發(fā)成本。當(dāng)然,無人駕駛模擬也存在不足:
第一,模擬生成的感知數(shù)據(jù)和真實(shí)的數(shù)據(jù)存在差異,實(shí)際中,還是以真實(shí)數(shù)據(jù)為主,生成數(shù)據(jù)為輔。
第二,模擬的規(guī)則是人制定的。很多失敗的場景恰恰是人思考的盲點(diǎn),單純通過模擬并不能發(fā)現(xiàn)。
總結(jié)來說,雖然模擬可以降低數(shù)據(jù)收集和測試車輛的數(shù)量,但是我們?nèi)匀恍枰占鎸?shí)數(shù)據(jù),用大量的車做真實(shí)測試。
單車成本主要由三部分構(gòu)成:設(shè)備成本,造車成本,運(yùn)營成本。
運(yùn)營成本就是駕駛員開著車采數(shù)據(jù)和做測試的成本。設(shè)備成本方面,我們可以發(fā)揮算法優(yōu)勢,通過多攝像頭等廉價(jià)設(shè)備實(shí)現(xiàn)無人駕駛。攝像頭是所有感知設(shè)備中信息量最大的,需要人腦水平的強(qiáng)人工智能,才能從間接視頻數(shù)據(jù)中提取出無人駕駛所需要的直接數(shù)據(jù)。激光雷達(dá)、高精GPS和IMU長期看都有降價(jià)空間,我們的技術(shù)方案不排除任何感知設(shè)備,價(jià)格合理,就會(huì)融合進(jìn)來。
造車成本和運(yùn)營成本已經(jīng)優(yōu)化了上百年,很難降低。一個(gè)聰明的想法是讓其他人承擔(dān)這部分成本——這個(gè)想法叫做眾包,代表性的公司有特斯拉和Mobileye。然而,遺憾的是,他們的眾包方案存在兩個(gè)問題:
第一,需要造車。特斯拉自己造車,Mobileye則通過合作伙伴造車。
第二,需要讀取和控制車輛駕駛行為。造車周期三到五年,顯著慢于算法研發(fā)節(jié)奏,成為時(shí)間瓶頸。如果為了加快迭代,在算法沒成熟的情況下強(qiáng)行上車,是拿人的生命做冒險(xiǎn),也顯然不可取。特斯拉的幾起致命事故就是血的教訓(xùn)。
因此,我們設(shè)想直接利用現(xiàn)有道路上已有的運(yùn)營車輛,不需要造車、改車、控制車,以一種零負(fù)擔(dān)、零危險(xiǎn)的方式實(shí)現(xiàn)眾包測試和數(shù)據(jù)收集,這是個(gè)非常困難的問題,需要非常深厚的算法積淀和原創(chuàng)能力。
無人駕駛的向?qū)А呔鹊貓D

高精度地圖是一個(gè)寬泛的概念,需要達(dá)到兩方面的高精度,分別是地標(biāo)位置的高精度和本車定位的高精度。
地標(biāo)位置的高精度。高精地圖由很多類地標(biāo)構(gòu)成,比如地面各種道路標(biāo)線,地上各種交通標(biāo)志等,地標(biāo)的定義現(xiàn)在還沒有明確的標(biāo)準(zhǔn),不同廠商從自己產(chǎn)品和技術(shù)需求出發(fā),有不同的定義方式。
本車定位的高精度。高精定位有三種方式:第一種是衛(wèi)星定位。多基站+差分GPS在開闊區(qū)域可以做到厘米級精度,但是城市中因?yàn)槎嗦窂叫?yīng),精度只有米;第二種是匹配定位,這種方式和人很像,觀察周圍環(huán)境或者地標(biāo),在記憶地圖中搜索,匹配定位。結(jié)合GPS限定搜索范圍,可以做到快速準(zhǔn)確匹配。第三種是積分定位。IMU或者視覺里程計(jì)。短時(shí)間內(nèi)精確,長時(shí)間有累積誤差。這三種方式各有優(yōu)缺點(diǎn),結(jié)合起來可以做到低成本、高精度、高可靠性。
高精度地圖是視覺的延伸和增強(qiáng),之于無人駕駛是必須的。一旦有了高精地圖的車道級定位和實(shí)時(shí)路況更新,就能提前減速并變換到到非車禍車道,杜絕事故的發(fā)生 。舉個(gè)例子:通過視覺,我們可以識(shí)別當(dāng)前在第幾車道,通過高精度地圖定位,我們也可以知道當(dāng)前在第幾車道,兩種不同方式互相校驗(yàn),可以達(dá)到更高的安全性??偨Y(jié)來說,高精地圖可以使無人車看得更遠(yuǎn),看得更準(zhǔn)。
高精地圖對于自動(dòng)駕駛整體解決方案研發(fā)的價(jià)值非常高,這一點(diǎn)卻被很多人忽視。分為三個(gè)方面:決策,測試,V2E。
第一方面,無人駕駛決策。本質(zhì)上,駕駛決策學(xué)習(xí)的是道路環(huán)境到駕駛行為的映射。如果獲得環(huán)境和行為的海量數(shù)據(jù),就可以通過數(shù)據(jù)驅(qū)動(dòng)的方式學(xué)習(xí)無人駕駛決策。道路環(huán)境可以通過視覺感知獲得,而司機(jī)的駕駛行為如何獲得?很多人認(rèn)為,司機(jī)的駕駛行為就是剎車油門方向盤,想要獲得,一定要有CAN總線權(quán)限,要改車。其實(shí)不需要。首先,更新一個(gè)概念,司機(jī)的駕駛行為還可以用車輛在高精地圖中的軌跡表示。通過精確定位,我們可以獲得每輛車的駕駛軌跡,以及軌跡上每一點(diǎn)的速度,加速度。駕駛軌跡是駕駛行為更通用的表示,與車型無關(guān)。剎車油門方向盤,雖然直觀,但不通用。人類司機(jī),換輛車,要調(diào)整駕駛習(xí)慣,重新適應(yīng),是同一道理。依賴高精地圖,我們可以獲得駕駛軌跡這一駕駛行為數(shù)據(jù)。通過眾包,就可以獲得海量環(huán)境和行為數(shù)據(jù),通過數(shù)據(jù)驅(qū)動(dòng)的方式學(xué)習(xí)無人駕駛決策。
第二方面,無人駕駛測試。當(dāng)無人駕駛算法接近人類駕駛的安全性時(shí),需要一千輛車測試一年的時(shí)間才有可能發(fā)現(xiàn)問題。如果團(tuán)隊(duì)像Google和百度一樣靠自己運(yùn)營測試車輛,顯然是不現(xiàn)實(shí)的。眾包是唯一實(shí)現(xiàn)海量測試的方法,但是我們不希望像特斯拉一樣,以消費(fèi)者的生命為代價(jià),測試自己未成熟的算法方案。通過高精度地圖,我們不控制車、不帶來危險(xiǎn),就可以實(shí)現(xiàn)眾包測試。具體原理是,我們可以預(yù)測駕駛軌跡,也記錄了真實(shí)駕駛軌跡。預(yù)測軌跡和真實(shí)軌跡比對,如果一致,說明測試通過,如果不一致,說明測試失敗。無人駕駛整體測試還包括無人車身體測試,以及身體和大腦結(jié)合的測試,也就是車輛測試和軌跡跟蹤測試。相比于無人車大腦,這兩部分成熟很多。
第三方面,V2E。V2E是指通過車輛和道路通信實(shí)現(xiàn)無人駕駛。概念上,V2E可以大大降低無人駕駛的難度,提高安全性。將V2E的概念真正落地到無人駕駛,其中主要有三方面的問題。第一,道路通信設(shè)備要解決供電、應(yīng)對風(fēng)吹日曬雨淋等技術(shù)可靠性問題,還要承擔(dān)基礎(chǔ)設(shè)施重建和復(fù)雜維護(hù)的高昂成本。第二,環(huán)境和車輛通信,需要統(tǒng)一的通信標(biāo)準(zhǔn)。誰來制定標(biāo)準(zhǔn)?眾多車企都以自己的利益為考慮,很難協(xié)調(diào)。第三,通信安全的問題。如果黑客或者恐怖分子利用通信協(xié)議漏洞,惡意操縱路面上的車輛,制造恐怖事件,又應(yīng)如何應(yīng)對?這些問題都限制了V2E從概念短期內(nèi)走向現(xiàn)實(shí)。相對于電子通信的V2E,我們提出“漸進(jìn)式的V2E”。無人駕駛的很多問題是因?yàn)榈缆窐?biāo)線、標(biāo)牌不足或者布置不合理造成的,通過高精地圖和基于高精地圖的測試,我們可以自動(dòng)發(fā)現(xiàn)哪些路段標(biāo)線和標(biāo)識(shí)需要改進(jìn),并給出改進(jìn)的具體實(shí)施方案。漸進(jìn)式V2E不需要電子通信設(shè)備,沒有通信標(biāo)準(zhǔn)和安全問題。在現(xiàn)有道路標(biāo)線、標(biāo)牌體系下,就可以大幅改善無人駕駛的可靠性和安全性。
視覺高精度地圖的實(shí)現(xiàn)
視覺高精度地圖的實(shí)現(xiàn)技術(shù),不是SLAM也不是SFM,這些方法都不適用。要建真正可用的視覺高精地圖,需要從第一原理出發(fā)重新設(shè)計(jì)整個(gè)算法。我們構(gòu)建高精地圖的第一原理是:多張圖像存在視差,利用點(diǎn)的對應(yīng)關(guān)系,可以從2D點(diǎn)恢復(fù)出3D點(diǎn)。人眼雙目視覺獲得深度也是這一原理。從基本原理出發(fā),建立高精地圖,需要?jiǎng)?chuàng)造性地解決三方面的問題:
圖像部分。檢測識(shí)別語義點(diǎn)。傳統(tǒng)的SLAM或者SFM算法都基于SIFT、ORB等人工設(shè)計(jì)的特征點(diǎn)。在光照、視角發(fā)生變化的情況下,無法準(zhǔn)確的檢測匹配原有特征點(diǎn)。換句話說,光照視角發(fā)生變化后,原來構(gòu)建的地圖就無法使用了。我們的方法是定義道路標(biāo)線、標(biāo)牌等地標(biāo)上的點(diǎn)作為語義點(diǎn),通過深度學(xué)習(xí)和數(shù)據(jù)驅(qū)動(dòng)的監(jiān)督訓(xùn)練得到模型,可以準(zhǔn)確檢測和識(shí)別語義點(diǎn),解決檢測不到、匹配錯(cuò)誤的問題。
幾何部分。通過眾包間接實(shí)現(xiàn)海量攝像頭測量效果。不同車輛,不同時(shí)間,經(jīng)過同一地標(biāo),即使光照視角不同,我們也可以通過語義點(diǎn)模型把所有車輛拍攝到的同一語義點(diǎn)關(guān)聯(lián)起來,這相當(dāng)于間接實(shí)現(xiàn)了多攝像頭測距的效果。我們知道,視覺測量中,攝像頭越多、視差覆蓋越全,測量精度就越高。我們實(shí)驗(yàn)驗(yàn)證,隨著眾包車次的增加,真實(shí)3D點(diǎn)位置估計(jì)的準(zhǔn)確性有量級上的提升。
GPS部分。給每個(gè)語義點(diǎn)精確的GPS坐標(biāo)。我們有幾方面的考慮:(1)讓高精地圖通用。GPS坐標(biāo)是地圖的通用語言,給每個(gè)語義點(diǎn)賦予GPS坐標(biāo),便于他人使用;(2)消除累積誤差。單純使用幾何方法構(gòu)建局部地圖,會(huì)有累積誤差。結(jié)合GPS,可以解決這個(gè)問題;(3)消除局部地圖歧義性。當(dāng)局部地圖有重合或者語義點(diǎn)缺失的時(shí)候,確定局部地圖坐標(biāo)系很麻煩,但全局GPS坐標(biāo)系沒有這個(gè)問題。