Google_Project Tango

? ? ? ? ? ? ? ? ? ? ? ? ? ? ?如何評價Google 的 Project Tango ?

Google 今天發(fā)布了一項名為 Project Tango 的計劃,希望藉此打造一款裝有 3D 感應器,并且能記錄運動、感知使用者周遭環(huán)境的 Android 手機原型機。目前它僅對一小部分開發(fā)者開放,而負責它的是 Google 旗下的 ATAP(先進技術(shù)與計劃)部門。

GOOGLE早前已經(jīng)收購了全球最優(yōu)秀的機器人和AI公司,現(xiàn)在還弄一個能感知環(huán)境的項目。名義上是手機用的程序,我覺得實際是在測試他們機器人的“眼睛”!骨架、大腦和眼睛都具備了,請問機器人離我們還遙遠嗎?

題主既然說到了機器人,就首先說一下,這個project tango確實跟機器人是有點關(guān)系的。硬件是目前robot vision的主流硬件,技術(shù)也是robot tracking和3D mapping的研究技術(shù)(最新談不上,但基本在此硬件上能應用的最新技術(shù)都用上了,而且還優(yōu)化不少)。

但與其說這個是一個結(jié)合機器人的設備,倒不如說是為機器與人的交互服務的,或者說是一個為AR應用量身設計的一個設備。

當我們現(xiàn)在在移動端談論AR的應用時,我們都談論些什么?給些最基本的:

物體識別,目標跟蹤,手機的能自主精確六自由度導航定位,對周圍3D場景進行描繪…

這些都涉及到現(xiàn)在一個新的研究方向,叫3D scene understanding,讓機器能理解周圍場景。

當機器能準確把握周圍場景,我們才可以在我們身旁的手機上實現(xiàn)一些更為高級的交互,比如跟現(xiàn)實場景設計游戲。

在移動端做這樣一個3D scene understanding的設備,為AR鋪墊,方便交互,就是google的目的。

為什么google要做一個新的手機原型呢?

因為現(xiàn)在的computer vision技術(shù)應用在我們的手機上,缺少傳感器,不適于做實時的AR應用。舉個例子,比如對三維場景需要知道深度。傳統(tǒng)相機只有一個攝像頭,深度雖然能估算出來,但是既不準,還耗費計算資源。這個手機上加了一個depth sensor,就簡化了很多問題。再比如處理器有兩塊是適于做computer vision的并行處理器,同樣是為了加速計算。

這樣一個手機有沒有意義?

當然有意義。尚且不知道google是否會把這個打造成一個同android類似的開源平臺。但是其結(jié)合了新的硬件以及相當多的機器人技術(shù)之后,這個手機平臺的系統(tǒng)會和android差異很大,也更加智能。google可以先做這樣一個嘗試。加上depth sensor和motion tracking camera對現(xiàn)在用戶來說必然是價格負擔,但是如果它能提供一定的AR應用,肯定有大批用戶難以拒絕的。

放個3D scene constructed by Project Tango,其能力已經(jīng)類似于Kinect + PC,未來還不夠樂觀么?


google收集的八家公司,多家與此技術(shù)有交集。抱歉之前工作比較忙,忘了更新。最近有很多新朋友關(guān)注。我簡述一下寫個番外。

首先說說Industrial Perception,個人猜測這個項目是以這個公司團隊作為核心。這個公司由Kurt Konolige和Gary Bradski創(chuàng)立,兩位都是在視覺導航方面的成果卓著的博士。這個公司原先的目標是構(gòu)建一個支持3D識別和自主導航的機器人框架,并把應用在工業(yè)機器人上(Startup Spotlight: Industrial Perception Building 3D Vision Guided Robots)。Project Tango這個項目雖然與機器人的實際應用不同,但是上面已經(jīng)說到了,其實二者的目標,和軟件框架都是非常相似的。

第二個是Meka robotics。Meka robotics比較著名的是與MIT media lab的人形機器人。不過與Boston Dynamic這種側(cè)重于機器人控制系統(tǒng)不同。他們最新的機器人研究側(cè)重于視覺和人機交互上(Meka Robotics Announces Mobile Manipulator With Kinect and ROS)。在使用3D信息的情況下,他們的軟件系統(tǒng)傾向于如何對周圍場景進行感知學習并做出反應。這也是上面說的3D scene understanding。

從目前Tango能夠?qū)崿F(xiàn)的效果來看,差不多能做到這二者的程度。在多傳感器融合問題上,其他六家公司也能提供一定的技術(shù)和專利支持,只能說有交集,但并不一定有所參與。比如Bot&Dolly,Boston Dynamics的平臺,都能實現(xiàn)六自由度的精確跟蹤控制,這個作為視覺跟蹤的一部分,應該Industrial Perception就已經(jīng)可以很好解決。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容