Depth-VR 創(chuàng)始人李今,VR 產(chǎn)品有可能像鼠標一樣便宜


本文來自愛范兒旗下創(chuàng)業(yè)社區(qū) MindStore 的“MindTalk 線場”欄目。如果希望參與到 MindStore 欄目報道,或者有相關(guān)項目推薦,請將產(chǎn)品提交到http://MindStore.io

最近,VR 成為最熱門的科學技術(shù),各行各業(yè)爭相開發(fā) VR 產(chǎn)品,期望掌握科技變革的先機。

在這股 VR 潮流剛興起時,Depth-VR 公司早已先發(fā)制人,在 2013 年就開始研發(fā) VR 的位置跟蹤系統(tǒng)。

然而在最開始,Depth-VR 只想做類似亞馬遜? Fire Phone 的一套系統(tǒng),主要的原理是通過紅外線跟蹤用戶的眼睛,再生成視覺的圖像,但產(chǎn)品并沒有成功。

2014 年 VR 開始爆發(fā),Depth-VR? 毅然轉(zhuǎn)變方向?qū)W⒀邪l(fā) VR,卻在中間不小心走一段彎路,跑去做頭盔,跟魅族聯(lián)合推出輕便版手機 VR 頭顯“畫風”。

Depth-VR 的 CEO 李今在 MindTalk? 分享時坦言,創(chuàng)業(yè)公司的身份,讓他們一直頻繁地轉(zhuǎn)變方向。但是對光學的位置跟蹤技術(shù),即現(xiàn)在大熱的 VR 交互技術(shù),是他們從 2013 年就開始堅持研發(fā)的方向。

做 VR 的緣由,最初來自于玩游戲時的異想天開

Depth-VR 如今能站在交互領(lǐng)域的領(lǐng)先地位,最初卻只是來源于一個異想天開的想法。

大學時候就喜歡玩 CS 的李今,迷戀上制作 3D 游戲。但是最開始用 3D-MAX 做 3D 游戲時,跟大部分初學者一樣,他遇到建模困難的問題。

“ 3D-MAX 的界面比較復雜,一般人上手太困難,學習周期需要三四個月的時間。學軟件之難,甚至會讓使用者把大部分精力投放在三維建模上,而不是創(chuàng)作上,這是非常不合理的?!?/p>

于是李金開始思考,怎么改變建模交互的方法。

一心要把 3D 簡化實現(xiàn),無奈想法錯誤終落空

2011 年,Depth-VR 開始深入研究 3D 建模軟件,發(fā)現(xiàn)三維建模的工作流程之所以復雜,是因為操作的本質(zhì)是用二維平面輸入建立三維的信息。

于是 Depth-VR 打算做一個便宜廉價的輸入系統(tǒng),它能夠代替鼠標捕捉手的空間位置。他們甚至會幻想像《鋼鐵俠》里面做模型的繪制,所有建模操作能在空中操作,當時 Depth-VR 的構(gòu)想跟 AR 相關(guān)。

“我們當時就想做一個三維的輸入系統(tǒng),讓計算機能夠知道你想表達的是一個什么意圖,非常直接的表達你三維的操作,而不需要通過鼠標去表達。 ”

不幸的是,李今不久后發(fā)現(xiàn)他們的想法是錯誤的,三維建模系統(tǒng)的重點根本不在輸入,而是視覺輸出的可視化這部分,最后項目只能暫時擱置。

轉(zhuǎn)變方向,把過去的思路和技術(shù)積累用在 VR 上

直至 2014 年 Oculus 的出現(xiàn),Depth-VR 才受到了啟發(fā),嘗試把從前的思路和技術(shù)積累用在 VR 上。

他們要做的 VR 位置跟蹤技術(shù),跟從前的技術(shù)要求不一樣。

“Oculus Rift 第一代 DK 出來的時候還沒有頭部位置跟蹤,也沒有提出位置跟蹤的概念,只有一個計算機系統(tǒng)的輸出端,但是完整的計算機系統(tǒng)是需要輸入和輸出兩個的,輸入當時沒人做。所以我們決定做輸入的環(huán)節(jié),這樣才能讓 VR 變成一個完整的計算機系統(tǒng)?!?/p>

但是 VR 交互技術(shù),在 2014 年的時候仍然是個又貴又冷門的玩意兒。

當時消費級的三維輸入只有 Leap Motion,其捕捉范圍太小,只能跟蹤手的運動。

其實 VR 里最重要的位置是頭部,假設(shè)在 VR 場景里,你要拿較遠的一瓶水,當你移動身體的時候,瓶子要離你越來越近,而不是跟著你的頭一起動。所以位置跟蹤尤為重要,它是 VR 系統(tǒng)實現(xiàn)的重要條件。

所以在 2014 年的時候,Depth VR 就開始正式做 VR 的位置跟蹤系統(tǒng)。

要做優(yōu)秀的 VR 位置跟蹤系統(tǒng),需要滿足幾個條件

第一要范圍夠大,才在? VR 場景里到處跑,然而這對位置跟蹤技術(shù)有著很高的要求,捕捉范圍要足夠大,至少要有 4×4 米的空間范圍才能實現(xiàn)場景運動和正常移動。

第二,精度的要求要高。除了空間位置要有較高的準確性,最重要的是減少位置跟蹤系統(tǒng)的抖動幅度,所謂抖動,正是源自系統(tǒng)里的噪音,例如圖像的噪音。而光學追蹤能避免系統(tǒng)噪音帶來的影響。

“我為什么要說精度和范圍的問題呢?因為這兩個東西加起來就構(gòu)成了位置跟蹤系統(tǒng)的體驗。體驗這個東西是很微妙的,它是由人來定位的。人又沒有一個標準,人的標準永遠是既苛刻,又很模糊,說不清的一個東西?!?/p>

除了精度和范圍,實現(xiàn) VR 交互系統(tǒng),還需要關(guān)注最后一點——延遲。延遲是指用戶真正的運動和他看到畫面運動時的時差,這又決定了 VR 的體驗。

當初除了以上的硬性指標, VR 位置跟蹤系統(tǒng)的產(chǎn)品還要足夠便宜。在李今看來,鼠標跟 VR 位置跟蹤系統(tǒng)類似,是同一個級別的輸入設(shè)備,差別在于,鼠標相比于三維的位置跟蹤系統(tǒng)而言,它輸入的是二維的一個坐標。

“我們可以通過鼠標的定價,來窺探大眾對運算平臺的成本期待。所以我們得出結(jié)論,如果整個位置跟蹤系統(tǒng)做到了鼠標這么便宜,才有資格成為一個消費級的產(chǎn)品?!?/p>

為尋實現(xiàn)方案,把人類史上的位置跟蹤方案看個遍

2014 年,在明確了這個位置跟蹤系統(tǒng)對性能還有成本的要求之后,Depth-VR 開始尋找 VR 位置跟蹤系統(tǒng)最適用的方案,他們按照聲光電磁慣性的順序,把整個人類歷史上用過這些位置跟蹤方案都看了一遍。

第一個研究的是超聲波定位技術(shù),因存在延遲和回聲反射的問題,以及追蹤目標數(shù)量太少、部署起來太麻煩等一系列缺憾,并不適合用作 VR 設(shè)備。

而電磁定位技術(shù)則需要理想的磁場環(huán)境,磁場容易被干擾,容易衰減或被去掉,因此用這種技術(shù)得到的坐標是一個不正確的坐標,所以也不作考慮。

最后一類是慣性動捕,這類叫 VMI 的產(chǎn)品,通過一套關(guān)節(jié)附近裝了 IMU 傳感器的衣服,測量人的每一根主要骨頭的姿態(tài),然后用鋼體模擬出一個木偶,去分析這個人的整個身體和每個關(guān)節(jié)的動作,假想這個人在地面走,和地面之間是完全沒有滑動摩擦的。

“我們看完聲光電這三種方案之后,覺得不是特別靠譜,沒有一個最優(yōu)方法。最后沒有辦法,我們又回到了光學位置跟蹤方法上。在現(xiàn)在和未來,這個行業(yè)的所有位置跟蹤技術(shù),基本上都會歸納到光學位置跟蹤里?!?/p>

Depth-VR 開始考慮做一個叫 SLAM 的方案,利用了一套存在很久的算法和理論,通過攝像頭的運動去分析環(huán)境,再進行算法反推自己的位置。Depth-VR 打算利用 iPhone 的處理器。

“有一個開源的算法我們直接移植到了 iPhone 上,在 iPhone 的攝像頭上罩了一個廣角的魚眼鏡頭,攝像機通過魚眼鏡頭拍到的圖像視角比較廣,就能看到將近 180 度的圖像,讓它的算法在 iPhone CPU 上跑?!?/p>

然而 iPhone 的 CPU 不給力,出現(xiàn)了跑完 SLAM 定位的 Demo 后無法正常游戲的情況。手機的運算能力有限,必須用專門的芯片,但開發(fā)成本過高,Depth-VR 無法承受。

Depth-VR 也有考慮過其它 VR 的巨頭公司在使用的方案,比如 Optitrack ,一個由美國的光學動捕領(lǐng)域的龍頭企業(yè)研發(fā)生產(chǎn)的產(chǎn)品。但 Depth-VR 在研究時發(fā)現(xiàn),這些攝像機非常昂貴,VR 位置跟蹤環(huán)境一套下來要幾十萬人民幣。出于對成本的考慮,Depth-VR 拋棄了很多方案,其中包括深度相機。

“大家都知道鼠標才幾十塊錢,你要是專門只完成一個定位的任務(wù)的話,這個設(shè)備的成本也不應(yīng)超過兩百塊錢吧,成本是非常敏感的。尤其是現(xiàn)在 VR 或

AR 的內(nèi)容還沒有起來的時候,設(shè)備必須走低價的路線,不然的話,你賣一個高價格缺少內(nèi)容的一個設(shè)備,幾乎不會有人買這種東西?!?/p>

參考各大廠家的定位方案,仍難尋最優(yōu)方案

為了找到最優(yōu)的實現(xiàn)方案,Depth-VR 不是沒有嘗試過向其它 VR 巨頭學習的。

索尼 PlayStation 的 3 代和 4 代的方案,是基于計算機視覺和光學動捕。Depth-VR 研究了他們的方案后,發(fā)現(xiàn)其運算量太大,要依賴主機。

“這個方案我們當時也拋棄了。因為我們對空間位置跟蹤設(shè)備的定義,是一個單獨的傳感器,不應(yīng)依賴任何的外部運算資源,我們想做的是一個脫離外部運算資源的獨立傳感器?!?/p>

和索尼一樣,Oculus 頭盔的定位系統(tǒng)也依賴 PC 去做位置跟蹤,于是Depth-VR 研究一番后又放棄了。

后來,他們看到唯一不依賴 PC 運算能力方案的 HTC

VIVE,精確度能達到零點幾度。但因為它采用激光還有其他的一些配件,外部整體的成本也比較高。它的成本不能滿足 Depth-VR

的要求,同時還存在激光會互相干擾,導致同一個空間不能擴展多個外部定位系統(tǒng)的問題。到最后,他們連 HTC VIVE 的方案都拋棄掉。

自成一套光學位置跟蹤系統(tǒng)

Depth-VR 花了一年的時間研究所有的方案,卻絕望地發(fā)現(xiàn)沒有一個原理是他們能夠直接使用的,不得不發(fā)展一套自己的光學位置跟蹤系統(tǒng)。

“新研發(fā)出來的系統(tǒng)比其它方案都要好,比如說它的跟蹤范圍及距離,還有延遲、精度,最重要是它的成本,都領(lǐng)先行業(yè)。我們還重新設(shè)計了攝像機的光學系統(tǒng),這與其它定位方案不一樣?!?/p>

Depth-VR 在光學結(jié)構(gòu)上做了一些創(chuàng)新。以前的攝像機,是一個鏡頭對一個傳感器,光線從鏡頭里進來打到傳感器上成像,再拿到電腦里做圖像分析。

“我們在鏡頭的后面加了一種很特殊的材料,它能夠把這個可見光反射到側(cè)面立起來,垂直站起來的這個圖像傳感器上,也就是側(cè)面的這個圖像傳感器可以接收到可見光,把

850nm—905nm 的紅外光直接透視到 45 度的反光鏡,直接打到地下紅外的傳感器上。這樣我們就能通過一個鏡頭獲得兩個不同波段的圖像?!?/p>

這個被命名為同軸多光譜相機的創(chuàng)新,顛覆了以前的攝像效果。

為了讓系統(tǒng)不依賴外部的運算設(shè)備,Depth-VR 做了很多工作。他們的設(shè)備是一個完全獨立于外部計算資源的一個傳感器,所有的運算在攝像機內(nèi)部進行。

令人稱奇的是,Depth-VR 用來做圖片處理運算的 CPU 是一個非常低端的 ARM 芯片,整個 VR 定位跟蹤系統(tǒng)成本能夠控制在 100 元以內(nèi)。

與此同時,Depth-VR 的 VR 定位跟蹤系統(tǒng)還非常優(yōu)秀,其他的參數(shù)比如精度能控制再 1mm 以內(nèi),做到差不多 0.1mm 的定位誤差,嚴格控制抖動程度。延遲也非常低,小于 5ms。

從 2014 年中旬開始,Depth-VR 按著光學思路研發(fā)產(chǎn)品,直至 2016 年成型。目前這個定義為傳感器的產(chǎn)品,能做到無限擴展,還能避免遮擋問題,能在大場景里面去大范圍部署并擴展它在位置跟蹤的范圍。

注:文中數(shù)據(jù)不做投資參考;感謝愛扒詞轉(zhuǎn)錄整理。

MindStore 是愛范兒旗下最新潮有趣的產(chǎn)品與想法分享平臺,在這里每天發(fā)現(xiàn)你感興趣的產(chǎn)品。歡迎關(guān)注微信公眾號:mindstoredyh ,微博:MindStore,獲得更多大咖線上分享和創(chuàng)業(yè)者訪談。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容