
前言
也許你已經(jīng)在生活中見識過AR(即增強現(xiàn)實)技術(shù)所帶給你的神奇感受了,肯德基搞過的魔法小精靈活動,騰訊QQ做過的火把傳遞,還有百度、阿里等都推出了自己的AR試水產(chǎn)品,應(yīng)該都曾讓你眼前一亮。作為一個旅游類ar應(yīng)用開發(fā)的從業(yè)者,一年時間越坑不少思考很多,如果你也想了解或者想一起設(shè)計一款適合自己的ar產(chǎn)品,本文想要和你一起分析一下AR應(yīng)用在技術(shù)和產(chǎn)品設(shè)計上的來龍去脈。畢竟,只讓用戶驚嘆的發(fā)出好神奇!好炫酷!的聲音顯然不是目的,更深入的思考增強現(xiàn)實技術(shù)如何為客戶帶來更多的實際用處和價值,才是更重要的事情。在思考的過程中,我們將首先了解一點ar技術(shù)的原理,歸納種種可能的應(yīng)用范圍,然后對用戶的需求特征進行深入挖掘,仔細(xì)分析如何讓技術(shù)以產(chǎn)品為載體,以可能最有趣的形式,把可能最有意義的東西呈現(xiàn)給你的用戶。

目錄
-
PART1 增強現(xiàn)實技術(shù)及其邊界
- 增強現(xiàn)實技術(shù)的原理
- 增強現(xiàn)實技術(shù)的邊界
-
PART2 用戶想要什么
- 從用戶的真實需求出發(fā)
- 用AR技術(shù)表達(dá)用戶需求的預(yù)期
- 分辨生活中的憧憬性預(yù)期和確定性預(yù)期
-
PART3 如何做出用戶喜愛的AR應(yīng)用
- 蘋果ARKit對智能手機的解決方案
- 決定智能手機/平板AR應(yīng)用體驗的四個要點
- 生活中最適合表達(dá)的確定性預(yù)期
- 應(yīng)用在智能手機/平板上適用的領(lǐng)域
- 用最恰當(dāng)和有趣的方式呈現(xiàn)虛擬物體

PART1 增強現(xiàn)實技術(shù)及其邊界
如果你覺得現(xiàn)實總是枯燥乏味,那么不要擔(dān)心,在上圖里的未來城市,你會被各種方便和有意思的虛擬信息所包圍,你不會覺得無聊,因為你可以隨時隨地修改你喜歡的環(huán)境樣貌,或調(diào)出你喜歡的游戲在各處玩耍,而且你也不再需要對著手機翻找周圍有哪些好吃的,因為它們隨時可以在你眼前給你最好的提示。AR技術(shù)會把我們的生活裝點得像科幻大片,虛擬信息統(tǒng)統(tǒng)飛出手機,來到世界的各個角落。我們都說現(xiàn)實是殘酷的,理想才是豐滿的,而讓理想的景象來到現(xiàn)實里做客,正是增強現(xiàn)實技術(shù)的目的。
增強現(xiàn)實技術(shù)的原理
自從人類有了畫家這個行當(dāng)以來,人們就有了一種能力,將現(xiàn)實中的三維的人或物體,描繪在一張二維的平面上。但如同文藝復(fù)興時期的米開朗基羅一樣,少數(shù)畫家還同時是一個雕塑家,能將二維平面或是頭腦中想象的事物還原為現(xiàn)實中的三維物體。如果從三維到二維的降維,就像畫一座冰山露出水面一角的樣子,還算是容易的,但要從這個冰山的一角,還原出整個冰山的三維原貌,由于你得不到當(dāng)時沒畫在畫里的任何額外信息,所以如果不借助想象力幾乎不可能做到,因為在從三維物體轉(zhuǎn)化到二維平面的時候信息都已經(jīng)丟失掉了。
然而人腦擁有一種能夠補充殘缺信息的強大能力,因為人的思維天生要求事物的起因、過程與后果必須是連續(xù)的、可理解的,如果中間不連續(xù),人就會自動腦補?;叵胍幌庐?dāng)你閱讀一段疏漏掉幾個文字的時候你也許都不會察覺,當(dāng)你在看完一集電視劇后總是急于想知道下一集會是怎樣,或你在看完一場魔術(shù)表演后為什么那么好奇它背后的原理,就可以知道人的腦補能力有多么強大和迫切了。于是,在你望著前方的道路的時候,你不用看腳也能腦補出你腳下踩的也是道路,而不會認(rèn)為是陷阱,當(dāng)我們站在一個房間的客廳中央,看向陽臺方向的時候,你腦中也可以順著墻面和天花板、墻面和地面的四條延長線,想象出身后的房間樣貌,這些對于人腦都是順手拈來。
不管人腦是怎樣做到腦補信息的,現(xiàn)在計算機在使用“機器視覺”的相關(guān)技術(shù)后,一定程度上也做到了。機器視覺實際上是人工智能技術(shù)的一個分支,目的是讓機器代替人眼,來對現(xiàn)實中的事物做精準(zhǔn)的測量或?qū)η闆r做正確的判斷。世界是三維的,而我們眼睛的視網(wǎng)膜或機器的觀測鏡面是二維的,人和機器都只能通過二維的方式去理解三維。機器一直在努力模仿人的能力,即通過已有的認(rèn)知再加上對當(dāng)前環(huán)境靜態(tài)和動態(tài)的觀察,判斷出當(dāng)前現(xiàn)實環(huán)境的具體情況以及自己在其中的位置,從而以此作為下一步行動的依據(jù)。那些在工業(yè)上檢測產(chǎn)品質(zhì)量的智能監(jiān)控裝置、自動駕駛汽車、深海探測機器人、無人機、火星探測車、甚至家庭的智能掃地機器人,都是因為有了機器視覺,對周邊環(huán)境有了相對準(zhǔn)確的了解,才能指導(dǎo)自己如何采取下一步行動完成自己的工作任務(wù)。

所以只要擁有機器視覺處理芯片及相關(guān)裝置,機器人或飛行器在行走或飛行的時候就能始終提前預(yù)知周圍現(xiàn)實場景的情況,就可以避免撞到墻等障礙物上面,當(dāng)對周圍環(huán)境有了仔細(xì)的探測或觀察之后,便對周圍的環(huán)境和物體信息了若指掌。還記得電影《盜墓筆記》里有這么一個情節(jié),壞的女特工在發(fā)現(xiàn)洞穴入口之后,立即掏出一打微型飛行器撒手放進洞穴,然后這些飛行器就在洞穴里到處飛行、各處掃描,將掃描信息回傳給了總部。這時大反派科學(xué)家在總部實驗室桌面上方的半空中,便開始看到一個整個洞穴內(nèi)部的虛擬模型正在神奇地慢慢搭建起來,從而讓整個洞穴的全貌以及內(nèi)部情況一覽無余。如果打開百度地圖的全景模式,你有時也會發(fā)現(xiàn)鼠標(biāo)指針不光放在地面上有指示的圓圈,在高樓的側(cè)面上也會有,百度采集車明顯是采集過環(huán)境中的建筑三維信息才能做得到。這種掃描技術(shù)就叫做“激光點云”技術(shù),采集裝置從一個點出發(fā)向四面八方發(fā)射激光射線,通過檢測反彈信號的時間和強度來獲取障礙物點的材質(zhì)信息以及距離,從而采集虛擬3D場景模型所需要的信息。


點云技術(shù)雖不在我們的討論話題,但它背后的技術(shù)基礎(chǔ),并同時也是機器視覺中最重要的算法,就是我們要說的“SLAM”算法(Simultaneous Localization and Mapping,同步定位及地圖構(gòu)建)。就是因為SLAM相關(guān)的算法讓機器有能力判斷出環(huán)境和其中物體的相對透視關(guān)系,通過自身對環(huán)境更多的數(shù)據(jù)采集和嘗試來跟蹤這種環(huán)境關(guān)系的變化,從而判斷出自身在環(huán)境中的精確定位。就像開車的時候突然不知道開到哪里了,除了多看看旁邊環(huán)境的特征和標(biāo)識外,還得再往前開一會兒多看看別的參照物,才能判斷自己在什么位置一樣。在SLAM算法中,比較重要的一個前提能力,就是要抓取和計算環(huán)境中明顯的對象輪廓和圖像特征,然后再根據(jù)它們的朝向和形狀,以及在自身運動過程中它們圖形的變化,來判斷出空間環(huán)境的邊界與透視關(guān)系。AR應(yīng)用和開發(fā)中“標(biāo)識物”的概念,其實就是指這些圖像特征點陣中的一部分區(qū)域,只不過這個區(qū)域可能是有完整圖案和意義的。標(biāo)識物越明顯,判斷環(huán)境的基礎(chǔ)依據(jù)就越準(zhǔn)確。所以我們說,SLAM算法是AR技術(shù)的基礎(chǔ)和核心,有了SLAM,AR才能把虛擬物體以最恰當(dāng)?shù)男问胶妥藨B(tài)放進現(xiàn)實。

增強現(xiàn)實技術(shù)的邊界
既然AR的基礎(chǔ)是SLAM,那么“把虛擬物體放入現(xiàn)實”這件事,就只能以SLAM的識別精準(zhǔn)程度為標(biāo)準(zhǔn)。也就是說AR技術(shù)相關(guān)的軟件的表現(xiàn)能有多好,除了必須看硬件支持情況外,剩下的得指望SLAM算法有多么成熟。基于SLAM,軟件程序能做的大概有以下四點:
- 如下圖所示,SLAM精確的識別出用來做環(huán)境建模參考的標(biāo)識區(qū)域點陣后,虛擬物體可以和這些有特征的點陣穩(wěn)定地進行綁定,環(huán)境標(biāo)識點陣變換到哪里,能計算出是什么方位,虛擬物體就也跟著一起去哪里、朝向什么方位。例如把虛擬精靈擺放在地面上,由于在鏡頭移動時SLAM檢測到地面的點陣信息也在移動,所以精靈才能夠在虛擬空間里跟隨地面一起移動。
- SLAM的環(huán)境建模信息可以告訴程序現(xiàn)實環(huán)境中各個封閉或開放型物體的三維模型點的位置都在哪里,程序通過這個虛擬地圖,計算出虛擬物體的活動邊界和限制。下圖中的小蛇才不會撞到墻上,也可以跳到桌子上、或從桌子邊緣跌落到實際的地面上。
- 在計算環(huán)境建模的點陣信息時,SLAM利用深度檢測算法,一并記錄了每個點的深度信息(也就是距離鏡頭的距離),有了這些深度距離,就可以做到讓距離小于小蛇的點陣所牽連的畫面部分,遮擋在環(huán)境中跑動著的小蛇的前面。一旦有了遮擋,虛擬小蛇就不再像是一個只是貼到鏡頭上的雜耍,它竟然能躲在現(xiàn)實物體之后,這樣畫面才一下子真實了許多。
- 同樣,有了這些環(huán)境的3D信息,也就能知道虛擬燈光等光源照射到相應(yīng)特征點上該怎樣發(fā)生怎樣的反射或折射,照射在小蛇身上的光線,被小蛇阻攔后該在它身下的哪些表示地面的點上,呈現(xiàn)出怎樣的陰影,并計算小蛇模型表面的顏色與強弱該如何隨光源的方位而變化,從而給虛擬小蛇模擬出更加貼合環(huán)境的真實光感和扎實的立在地上的感覺,讓這種虛擬世界的生物就像真的活在了現(xiàn)實中一樣,栩栩如生地站在那里。


雖然基于機器視覺的理論基礎(chǔ)在20世紀(jì)后期就已經(jīng)非常完備,但由于現(xiàn)實環(huán)境的復(fù)雜性,需要的強力的運算能力和圖形處理能力才能有希望實現(xiàn)。直到這個世紀(jì)初隨著硬件技術(shù)的快速發(fā)展并出現(xiàn)了SLAM算法,基本開發(fā)需求才開始被迅速滿足。但即便如此技術(shù)仍還在快速的完善中,在可接受的成本范圍內(nèi)往往得不到滿意的功能效果。所以AR應(yīng)用必須考慮對自己來說劃算的硬件載體,例如機器人、飛行器或智能監(jiān)控裝置、增強現(xiàn)實眼鏡,或是使用智能手機和平板。
機器人和監(jiān)控攝像頭等載體重點在于采集和識別環(huán)境信息,從而判定和指導(dǎo)自己下一步的行為,所以對于普通的增強現(xiàn)實應(yīng)用的開發(fā)者來說,只有增強現(xiàn)實眼鏡與智能手機/平板,這種帶有反饋用戶信息的顯示屏的設(shè)備,才最適合制作“將虛擬物體投入現(xiàn)實環(huán)境”的AR應(yīng)用。
智能手機/平板利用其屏幕和攝像頭等傳感器,借助OpenCV等機器視覺算法庫,以及市面上已經(jīng)出現(xiàn)的一些更簡易的ARSDK的開發(fā)包支持,相當(dāng)于一種AR眼鏡的屏幕簡化版。但比起AR眼鏡,由于計算芯片能力所限,在最拖累計算效率的SLAM模塊上有著許多的功能閹割,在以上所述SLAM功能上只能在第一點,具有明顯點陣特征標(biāo)識物的識別上體驗較好,環(huán)境邊界檢測、遮擋以及光照陰影計算只有最簡易的表現(xiàn),很多還達(dá)不到滿意的程度,簡化后的算法版本距離最好的視覺體驗還有很大的距離。

即便是AR眼鏡,在幾個最重要研發(fā)廠商的產(chǎn)品里,也還沒有一個能做到讓人完全滿意的用戶體驗。增強現(xiàn)實眼鏡由于昂貴的價格和較高的開發(fā)成本,只能做一些較大的行業(yè)級應(yīng)用。所以無論AR眼鏡還是智能手機/平板,目前還不能想做什么就做什么,開發(fā)增強現(xiàn)實應(yīng)用時,最怕的就是拿著科幻大片里的效果,指望著AR眼鏡或智能手機/平板能夠開發(fā)出來。
總之,以機器視覺為基礎(chǔ)建立起的SLAM算法是AR的核心,SLAM與當(dāng)前硬件設(shè)備的技術(shù)成熟度,劃定了AR技術(shù)產(chǎn)品的邊界,使得我們只能開發(fā)邊界之內(nèi)的產(chǎn)品。但是,就像數(shù)學(xué)上的“無窮”除以100還是“無窮”一樣,即使邊界再狹窄,增強現(xiàn)實的想象空間依然是無限的。
PART2 用戶想要什么
了解了技術(shù)的功能邊界,我們可以再試著換到用戶的角度,看一下用戶想要什么,才好對那些我們萌生出的很多想法進行篩選和過濾。
從用戶的真實需求出發(fā)
人這個物種就是欲望的集合,人們時時刻刻都有這樣或那樣的想做、在做的事情,而時時刻刻都可能有著種種對應(yīng)的產(chǎn)品來滿足這些當(dāng)下的需求,作為一個人在生活里的行為,這些“需求”是真實存在的,因為用戶真的在做這件事。所以,用戶的真實需求就是無論如何都是他本來要做的事情,這時候的產(chǎn)品只是幫助他更好更快的做這件事情而已。進一步說,如果人們當(dāng)前要做的這件事越難以被外界干擾和改變,就越是用戶的真實需求,而不是可有可無,而另外,如果認(rèn)為“好玩就會產(chǎn)生用戶需求”、“我的需求肯定就是用戶的需求”,都不一定是可靠的,都需要冒風(fēng)險花成本去現(xiàn)實中盡快驗證。
用AR技術(shù)表達(dá)用戶需求的預(yù)期
雖然AR的本質(zhì)是將虛擬物體或景象放入現(xiàn)實環(huán)境中,但對于人們來說,往往現(xiàn)實是現(xiàn)實,虛擬是虛擬,就像理想再豐滿現(xiàn)實也很骨感、游戲玩得再好肚子也依然會餓一樣,AR就是讓事物變得更好,而不是改變事物本身,畢竟現(xiàn)實里的人類沒有AR,也繁衍了好幾萬年。在未來真正成熟的AR技術(shù)大量的出現(xiàn)在生活里之前,人們時時刻刻還是得應(yīng)對現(xiàn)實問題,有用的AR應(yīng)用需要從人的現(xiàn)實問題出發(fā)。
人類區(qū)別于動物的核心一點就是大腦皮質(zhì)的思維能力,從而讓我們在現(xiàn)實的每件事上比動物更能夠想象出更遠(yuǎn)的預(yù)期,這種預(yù)期能指導(dǎo)我們下一步的行為,即便見到不確定的事情我們也經(jīng)過思考后會做出決策,至于結(jié)果是好是壞,都依靠我們對這件事情當(dāng)時的預(yù)期。換句話說,人們的生活是現(xiàn)實的,但對當(dāng)前所做事情目標(biāo)狀態(tài)的預(yù)期是虛擬的,是存在于人腦中的一種想象,這種想象基于嗜好和習(xí)慣、過去的經(jīng)驗或是對公共標(biāo)準(zhǔn)答案的記憶和認(rèn)知。
所以,既然AR的特征就是在現(xiàn)實里表達(dá)虛擬,那么對于人們現(xiàn)實里的事情,AR就正巧有希望幫助人們表達(dá)出他們本來就對事物抱有的那些虛擬的預(yù)期。如果將預(yù)期的目標(biāo)景象以某種形式呈現(xiàn)到人的面前,為用戶提供最可靠的決策方案或行動指引的話,AR技術(shù)就能非常自然的接入人的生活了。
不管在科幻電影還是在小說里,我們早已經(jīng)看到過這樣的例子:
- 在主人公開車的時候,路牌更加豐富,并且是虛擬的,前方道路的地面上也會顯示出巨大的箭頭給你指引;
- 當(dāng)鋼鐵俠來到他的房間控制各種系統(tǒng)設(shè)備的時候,擺手就能在空中調(diào)出虛擬屏幕,徒手進行界面操作;
- 宇宙飛船上的船員想在會議室與地球總部的BOSS開會,他的幻影影像可以直接出現(xiàn)在會議室的大廳中。

所以基于真實需求進行AR技術(shù)的預(yù)期呈現(xiàn),能夠非常完整的指導(dǎo)人們處理他要做的事情,現(xiàn)實與虛擬在具體的實踐中,理論上可以做到非常完美的結(jié)合,從而讓以前那些我們只能靠體力和經(jīng)驗、靠摸索和運氣,尤其是靠時間才能完成的事情和工作任務(wù),通過它可以順利和快速的,并且用更準(zhǔn)確的方式完成。
分辨生活中的憧憬性預(yù)期和確定性預(yù)期
在生活中,幾乎人所有的現(xiàn)實行為都具有這樣或那樣的預(yù)期,因為人只有對事物有預(yù)期,才能有安全感。人的思考是線性的、連續(xù)的,如果連續(xù)性被打破、被模糊,人們就會陷入驚奇、困惑甚至恐懼,生活的安逸不就是來自于這種穩(wěn)定的、線性的可見預(yù)期嗎,那種希望最好時時都有,哪怕它是錯的,甚至我們心知肚明這種預(yù)期是不可能實現(xiàn)的、一直在騙自己,那也好過沒有預(yù)期。所以人們無論在做什么,都始終走在實現(xiàn)某個預(yù)期的目標(biāo)之路上,并努力規(guī)避那些不符合預(yù)期的結(jié)果。例如:
- 我在運動減肥,我的預(yù)期是一個變瘦了的自己,越減越肥不是我的預(yù)期;
- 我在化妝,我的預(yù)期是一個好看的自己,化成妖孽也不是我的預(yù)期;
- 我在走路,我的預(yù)期是到達(dá)我想到達(dá)的地方,突然迷路必然也不是我的預(yù)期;
- 我在打掃衛(wèi)生,我的預(yù)期是一個干凈的環(huán)境,老有熊孩子搗亂或打掃后看不到效果,我以后就傾向于不去打掃。
然后,既然是預(yù)期的目標(biāo),就是要達(dá)成它,就需要有一種可衡量的標(biāo)準(zhǔn)來告訴我們“這件事我做到了”,然而如果說“走路走到地方”這種事情是肯定可以衡量的,那么生活里還有無數(shù)的事情是不好衡量甚至沒法衡量的,比如:
- 我在努力賺錢,我的預(yù)期是賺錢之后有一個更幸福的生活。
什么叫更幸福的生活?就算定一個幸福的標(biāo)準(zhǔn),你獲得后會保證知足嗎? - 我在說服對方,我的預(yù)期是讓他能理解我的觀點。
“理解自己的觀點”是一種什么樣的情況?萬一他口服心不服你卻不知道呢? - 我一直在學(xué)習(xí),我的預(yù)期是讓自己變得更強。
怎么叫變得更強?會不會永無止境呢?
這樣的預(yù)期,自然對于軟件程序來說不可衡量,但對于人來說還是有很多現(xiàn)實意義,畢竟從古至今無數(shù)的人們正是懷著某些莫名奇妙的預(yù)期,固執(zhí)的活著、堅強的活著。有時候這就叫做信仰吧。因此我們暫且稱這種預(yù)期為“憧憬性預(yù)期”。由于軟件技術(shù)需要確定性的量化信息,所以AR技術(shù)對于此種預(yù)期是無可奈何的,我們需要尋找的是那些明確的、具體的、存在可行實現(xiàn)方法的預(yù)期,那樣才是可以被程序量化和描述的。所幸這樣的需求也有無數(shù)種,例如:
- 我在開車,我要去一個地方;
- 我在施工,我要按照設(shè)計圖蓋一個房子;
- 我在修復(fù)文物,我要把文物修成以前的樣子;
- 我在操作一臺新設(shè)備,我想要學(xué)習(xí)如何使用這臺設(shè)備;
- 我在做一道數(shù)學(xué)題,我要得到正確答案;
- 我在景區(qū)觀光,我想要知道怎么走才能逛得比較好;
- 孩子們在看書認(rèn)識動物,他們對這些動物的知識很感興趣;
- 我在設(shè)計3D模型,2D的屏幕上必須總得通過旋轉(zhuǎn)模型才能看到完整的樣子,我想要直接看到;
- ……


可見,即便這種需求的結(jié)果依然有好有壞,有多種結(jié)果的可能性,但總歸是有相對確定的結(jié)果信息可以被技術(shù)所描述的。因此可以說,基于用戶真實需求的AR技術(shù)應(yīng)用,要表達(dá)的正是這一類生活中的確定性預(yù)期,需要依照確定性預(yù)期這一標(biāo)準(zhǔn)來篩選需求。
PART3 如何做出用戶喜愛的AR應(yīng)用
就像我們前面提到的,昂貴的AR眼鏡還沒有普及,而且還有這樣或那樣的問題,還因為篇幅和經(jīng)驗所限,我們?nèi)绻胍O(shè)計和開發(fā)用戶級產(chǎn)品,可以先思考一下怎樣在智能手機/平板上做出一款用戶喜愛的AR產(chǎn)品。
蘋果ARKit對智能手機的解決方案
在智能手機上表現(xiàn)AR效果,首先就會存在以下三個問題:
- 用戶行為成本較高:用戶必須一直端著手機;
- 復(fù)雜環(huán)境的識別能力較差:由于軟硬件的限制,手機只能擁有閹割后的不完整SLAM算法支持,不能奢望做出與復(fù)雜環(huán)境結(jié)合非常貼切的效果;
- 視野狹窄難以呈現(xiàn)全貌:手機屏幕只能看到一部分視野內(nèi)容,其他方位上哪里需要發(fā)現(xiàn),用戶就必須將手機朝向哪里。這也提高了用戶的行為成本。
其實前一陣蘋果2017新品發(fā)布會上展示的ARKit的游戲展示,就巧妙地通過產(chǎn)品設(shè)計讓問題得到了解決:
- 用戶通常在什么情況下非常投入地端著手機?玩游戲??;
- 既然對復(fù)雜環(huán)境不能很好的分析,那么就不識別復(fù)雜環(huán)境,只用一張桌子就可以了,將這種最簡單的平面作為標(biāo)識物顯示出游戲地圖;
- 手機游戲的視野本來就狹窄,而在手機游戲里,問題不在于視野狹窄,而在于用戶一貫的用手指去移動游戲地圖的操作成本。以前玩家必須用手指在手機屏幕上移動地圖,現(xiàn)在玩家可以不做這個煩心的操作,只需要無腦地挪動手臂的朝向和位置,就達(dá)到了移動地圖的效果,同時手機本身在游戲里還充當(dāng)了一架在空中飛行的戰(zhàn)斗機的角色,一舉兩得的解決了問題。

于是,這一表面看似換湯不換藥沒有太多亮點的游戲展示,實際上是用AR技術(shù),以最現(xiàn)實有效的辦法解決了游戲玩家的操作體驗問題。
決定智能手機/平板AR應(yīng)用體驗的四個要點
無論是游戲還是其他類型的AR應(yīng)用,在智能手機/平板上有一些要點需要考慮,每一個要點的支持情況都決定著用戶體驗是否可以滿足要求。
-
網(wǎng)絡(luò)支持
有網(wǎng)還是無網(wǎng),有網(wǎng)情況下是帶寬高流量大,還是帶寬窄流量小,都絕對限制著應(yīng)用的性質(zhì)和表現(xiàn)能力。如果沒有網(wǎng)絡(luò)我們可能只能做封閉的單機應(yīng)用,連用戶記錄都不能做到云端存儲,而在網(wǎng)絡(luò)和帶寬情況極好的情況下,不光本地應(yīng)用的容量可以做得極小,而且可以全程通過網(wǎng)絡(luò)傳輸來呈現(xiàn)內(nèi)容,甚至使用實時的高精度模型動畫及在線播放高清視頻。 -
現(xiàn)實環(huán)境標(biāo)識物/介質(zhì)支持
現(xiàn)實環(huán)境的標(biāo)識物,提供了現(xiàn)實環(huán)境的坐標(biāo)系參照,它一方面決定了虛擬物體出現(xiàn)在現(xiàn)實里時的可見性和穩(wěn)定性,另一方面也決定了用戶對AR應(yīng)用的認(rèn)知成本。AR應(yīng)用如果沒有穩(wěn)定明顯的標(biāo)識物物體的協(xié)助,或是標(biāo)識物在現(xiàn)實環(huán)境中讓人不便尋找,都會讓人覺得這不是一個完整的產(chǎn)品,從而形成認(rèn)知困惑,造成用戶的流失。所以,要么標(biāo)識物用固定場景下大家熟知和最常見的東西,并且能輕易的知道哪里是那個需要掃描的物體,要么把標(biāo)識物與應(yīng)用程序捆綁發(fā)布,讓人唾手可得。 -
GPS與陀螺儀定位支持
雖然手機平板上的SLAM還不夠強,但設(shè)備上能通過GPS獲得自身位置的地理定位信息,如果它足夠精確,再加上陀螺儀模塊提供的鏡頭的當(dāng)前朝向,通過對比已經(jīng)存儲在應(yīng)用里的地圖數(shù)據(jù)和場景內(nèi)容,就能精準(zhǔn)的知道在哪里該投放什么樣的虛擬物體,方位的問題就無需SLAM的幫助了,而且可能連標(biāo)識物是否需要存在都變得無足輕重。然而這兩點在現(xiàn)有設(shè)備上還遠(yuǎn)遠(yuǎn)達(dá)不到那樣的準(zhǔn)確程度,陀螺儀在各個手機上的表現(xiàn)也參差不齊。對于這兩個硬傷,AR應(yīng)用如果要想保證穩(wěn)定的用戶體驗,考慮設(shè)計時就要規(guī)避這個短板,例如,對于GPS只考慮在公路或道路上信號比較精準(zhǔn)時使用,或者第三方地圖平臺支持的在商場等室內(nèi)有精準(zhǔn)定位服務(wù)時使用,其它位置則不使用它指導(dǎo)AR呈現(xiàn);而對于陀螺儀的方位功能則作為應(yīng)用的附屬,即便不好用也不會影響主要功能。 -
貼合AR技術(shù)的產(chǎn)品設(shè)計
由于AR應(yīng)用需要呈現(xiàn)虛擬內(nèi)容,而純粹虛擬內(nèi)容的APP明顯以游戲方式最為擅長,于是AR應(yīng)用多少都會摻有游戲的成分在里面。但是,傳統(tǒng)的游戲設(shè)計可以純粹按照完全杜撰的世界觀和虛擬內(nèi)容來隨意布置整個世界,而AR應(yīng)用則由于受現(xiàn)實環(huán)境限制,所以必須考慮線下環(huán)境的成分。這樣在產(chǎn)品設(shè)計時,就非常不同于傳統(tǒng)形式的APP應(yīng)用程序,并且也不同于游戲。我們可以將這種產(chǎn)品分成“應(yīng)用本身”與“環(huán)境介質(zhì)”兩部分,環(huán)境介質(zhì)上要有安裝應(yīng)用的入口,應(yīng)用里也要引導(dǎo)用戶如何使用環(huán)境介質(zhì)。
由于產(chǎn)品被分成了兩部分,那么表現(xiàn)也可能因此不同。應(yīng)用在使用到環(huán)境介質(zhì)之前,可以按照應(yīng)用自己的表達(dá)方式進行界面設(shè)計,但是一旦與環(huán)境介質(zhì)一起呈現(xiàn)虛擬成分,那么就最好離開屏幕的2D交互模式,與真實三維場景中的介質(zhì)以及3D虛擬物體配合起來,進入虛擬場景中的3D交互模式,交互界面將出現(xiàn)在環(huán)境介質(zhì)里、虛擬物體上、或者懸浮在半空中,如此表達(dá)一種觸碰世界本身的感覺。
但應(yīng)用與介質(zhì)分離的情況,會導(dǎo)致用戶獲取介質(zhì)比獲取應(yīng)用的行動成本高得多的問題,并不利于產(chǎn)品的傳播。所以當(dāng)用戶分享了一張應(yīng)用生成的AR畫面給朋友后,怎樣讓他的朋友除了覺得炫酷贊嘆一下以外,還能很容易的獲取到環(huán)境介質(zhì)并下載應(yīng)用,一起玩起來,是一個需要考慮的問題。例如,產(chǎn)品設(shè)計中的互動規(guī)則如果必須由多個人一起完成,這樣也許可以形成人與人之間更有力的傳播。

綜合這四個要點可以看到,在5G到來之前,網(wǎng)絡(luò)支持只能算剛及格,現(xiàn)在手機平板的GPS與陀螺儀定位的表現(xiàn)也還很不穩(wěn)定,只有較低獲取成本的現(xiàn)實環(huán)境標(biāo)識物、和最貼合的產(chǎn)品設(shè)計這兩個可以由優(yōu)秀的產(chǎn)品設(shè)計人員進行把控。所以可以說,如果考慮一個最低風(fēng)險的產(chǎn)品目標(biāo),那就是一個:盡量避免使用GPS和陀螺儀定位、不太依賴于網(wǎng)絡(luò)支持、最易獲取或綁定應(yīng)用的環(huán)境標(biāo)識物、巧妙融合應(yīng)用與游戲的產(chǎn)品設(shè)計的AR應(yīng)用。反之,最高風(fēng)險的產(chǎn)品目標(biāo)則是:需要大網(wǎng)絡(luò)流量支持、必須基于地理位置定位和方位、需要靠用戶自己尋找標(biāo)識物、同時產(chǎn)品設(shè)計上不方便不適合AR技術(shù)呈現(xiàn),這樣理想化的一款應(yīng)用。
生活中最適合表達(dá)的確定性預(yù)期
我們讓AR應(yīng)用表達(dá)點什么確定性預(yù)期呢?生活中究竟什么樣的事情是有明確目標(biāo)或標(biāo)準(zhǔn)答案的?經(jīng)過前文關(guān)于確定性預(yù)期的分析和舉例,我們會總結(jié)出確定性預(yù)期會有下列需求特征:
- 描述型:中國的首都是北京、這個鼻子很長的動物是大象、人的這個位置是心臟等,展示各種事實的信息;
- 導(dǎo)航型:人們到達(dá)一個地方之前的有限種最短路線信息;
- 建造型:按照預(yù)定的樣子復(fù)制或建造,例如一點點的增加零件、一層層的蓋樓房;
- 解題型:往往具有有限解的數(shù)學(xué)/幾何/物理等底層學(xué)科的相關(guān)問題;
- 動作型:如機械設(shè)備操作方法、健身和做操的教學(xué)等,具有有限種固定的動作模式;
- 線索型:即便需求沒有確定性預(yù)期,但該不確定性預(yù)期有時卻有一些確定性的線索,例如:要想知道是什么導(dǎo)致了亡國,需要從調(diào)查皇帝當(dāng)時吃的一個藍(lán)色小藥丸開始……
……
當(dāng)然還可以舉出一些,但也許其中的規(guī)律是:
- 大部分的“是什么”型需求(What):“是什么”一般都是在描述事實,而事實大多是確定的;
- 一部分的“怎么做”型需求(How):一部分“怎么做”是有相對標(biāo)準(zhǔn)的答案的,并且如果再改為“怎么做最好”的問題,可能會更多;
- 少數(shù)“為什么”型的需求(Why):關(guān)于為什么的問題往往沒有唯一的答案,眾說紛紜看自己信什么。
可以想見在各行業(yè)中,教育行業(yè)的What用處最多,How各行各業(yè)都有。國內(nèi)最早的AR產(chǎn)品之一“涂涂樂”火起來就是發(fā)現(xiàn)并發(fā)掘了教育領(lǐng)域這個最重要的AR金礦。原因很簡單,最簡單的AR應(yīng)用需要對標(biāo)識物進行識別,而識別標(biāo)識物的同時,自然就可以想到能對它進行解釋,解釋它“是什么”,就能展示出對現(xiàn)實世界的提示。在此基礎(chǔ)上,如果掃描大象的圖片只出現(xiàn)“這是大象”的解釋,就不如增加一些炫酷的3D模型和動畫效果,讓大象活起來,就比枯燥的文字要好玩的多了。


應(yīng)用在智能手機/平板上適用的領(lǐng)域
人是能懶就懶的,所以在做一件事情,尤其是一件本身就動用身體的事情的時候,就無法集中注意力在行為成本高的其他事情上,例如跑步的時候,我們不喜歡老跟同伴說話,但可以邊跑邊聽音樂,因為說話需要費體力,聽音樂則不需要;再比如吃飯的時候,我們只需要抬起頭就可以看電視,而這時拿起手機對著某物玩AR就是很費力的。同樣,在人們使用技能處理各種工作任務(wù)時,總是占用著雙手,這時除非我們戴上眼鏡甚至用裸眼就能看到虛擬物體,否則這些事情即便再有需要也不方便使用。除非我們在做以下這些事情:
- 游戲娛樂:利用AR應(yīng)用更好的玩游戲、玩玩具;
- 知識學(xué)習(xí):利用AR應(yīng)用學(xué)習(xí)書本知識;
- 技能學(xué)習(xí):利用AR應(yīng)用學(xué)習(xí)若干固定步驟組成的技能;
- 欣賞靜物:利用AR應(yīng)用看到一幅更炫目更完整的畫或一座雕塑等。
- ……
很明顯,學(xué)習(xí)知識適用于描述型、解題型等預(yù)期形式,而學(xué)習(xí)技能適用于動作型,欣賞作品則適用于描述型,因為游戲的邊界極寬,所以游戲娛樂適用于前文所述各種類型的預(yù)期。在行業(yè)上,游戲娛樂、教育培訓(xùn)、玩具禮品、設(shè)備機械、建筑工程等等行業(yè),都是可以有潛力用到AR技術(shù)的領(lǐng)域。
在學(xué)習(xí)有固定步驟的技能時,將步驟的指引在屏幕上相對于現(xiàn)實實物的位置明確地一個個標(biāo)注出來,就可以給用戶提供可用的提示。比如按某固定流程操作機器,AR應(yīng)用將每一步的虛擬指引,顯示在相應(yīng)的操作位置上。學(xué)做一個蛋糕?學(xué)炒一盤菜?學(xué)一首鋼琴曲?都可以如法炮制。
而前文提到的“導(dǎo)航型”所相關(guān)的交通出行、旅游等行業(yè),由于暫時無法和GPS以及陀螺儀精確配合,難以做到穩(wěn)定的產(chǎn)品表現(xiàn),所以需要對需求更謹(jǐn)慎的篩選和考慮。

用最恰當(dāng)和有趣的方式呈現(xiàn)虛擬物體
討論了AR應(yīng)用適用的領(lǐng)域之后,那么我們就可以通過三個步驟,讓虛擬世界的物體活生生的出現(xiàn)在現(xiàn)實里。
第一步,讓虛擬物以兩大表現(xiàn)模式呈現(xiàn)出來
-
召喚模式
我們可以用召喚模式強調(diào)呈現(xiàn)出的虛擬物體,識別標(biāo)識物之后憑空生成出與標(biāo)識物關(guān)系不大的虛擬物體。比如模型或特效動畫之類,這樣我們就能實現(xiàn)識別神燈后飄出能滿足你三個愿望的燈神,以及我們文中出現(xiàn)各種虛擬角色的例子都是使用這種模式,在游戲類型的創(chuàng)意中非常常見。 -
增強模式
該模式強調(diào)對于標(biāo)識物的修飾,識別后生成出與環(huán)境標(biāo)識物密切相關(guān)的虛擬物體,表現(xiàn)方式可以有:
- 特效增強:將電光火石煙塵水霧等粒子特效疊加在標(biāo)識物的表面,例如體現(xiàn)出英雄雕像的氣場,讓肖像畫流淚;
- 部件補充:讓虛擬物與現(xiàn)實標(biāo)識物相加,才能組成完整的物體,例如貝殼里出現(xiàn)珍珠、掃描殘缺的地圖后補完這張地圖;如果是2D標(biāo)識物,補充方式可以在第三個維度上進行3D補充,例如識別一張充滿曲線的現(xiàn)代繪畫作品時,讓曲線突出畫作成為三維曲線等。
- 部件標(biāo)注:在現(xiàn)實標(biāo)識物上呈現(xiàn)出對于其中部件的注解、指引等提示信息,導(dǎo)覽、培訓(xùn)和教學(xué)類需求中需要經(jīng)常使用。如我們上文中用戶操作設(shè)備時可按照屏幕的標(biāo)注提示,進行下一步操作或?qū)W習(xí)。
- 內(nèi)容變換:動態(tài)修改標(biāo)識物表面的內(nèi)容,常用的一種辦法是使用視頻疊加,如識別一輛飛馳中的賽車圖片,賽車真的動了起來,甚至駛出圖片范圍撲面而來等。




第二步,和虛擬物一起進入互動
虛擬物體或角色出現(xiàn)之后,用戶就需要開始和它進行需要的交互操作了,可以使用以下幾種交互模式來進行:
- 形體交互:需要仔細(xì)觀察玩偶或古玩模型時,控制虛擬物的大小或朝向方位,可以在屏幕上對其進行旋轉(zhuǎn)、縮放等操作。
- 界面交互:讓虛擬物體的旁邊出現(xiàn)操作按鈕和選項,進行對虛擬物的控制操作。比如讓一輛跑車模型的旁邊出現(xiàn)切換車身顏色的選項;而如果虛擬物本身就是操作界面,那就直接在其表面進行操作,比如密碼鎖可以點擊密碼開鎖,或華容道小游戲直接點擊可玩。
- 動畫交互:用戶在觸碰虛擬物體或角色時,它會以播放一個動畫或動作的方式反饋給用戶。若通過選項進行交互,就使用上述界面交互來控制它的動畫效果。
- 場景交互:讓虛擬物體或角色和它所在的真實場景進行適當(dāng)?shù)漠a(chǎn)生互動。例如虛擬角色如果是小槍手,那么用戶在屏幕上指到哪里,它就開槍打到哪里,如果是一輛小賽車,用戶指到哪里,小賽車就會開到哪里。如果未來能夠結(jié)合前文所提SLAM算法完整的環(huán)境監(jiān)測,角色就可以完全躲避現(xiàn)實中的障礙物體。
- 關(guān)聯(lián)交互:讓多個標(biāo)識物產(chǎn)生的虛擬物,彼此交互。例如利用讓用戶收集AR卡牌,如果兩張卡牌呈現(xiàn)出匹配度高的異性,那么他們會相互親吻,如果是沖突度高的同性,那么用戶需要控制他們相互PK對戰(zhàn)等。國外還有一個有趣的產(chǎn)品,讓孩子們收集和掃描卡牌,當(dāng)識別出一張卡牌時出現(xiàn)動物的介紹,而同時識別出兩張卡牌時它們竟然組合了起來,鳥頭牛身、豬頭魚身,創(chuàng)造一個個新物種。





第三步,交互結(jié)束后給用戶一個結(jié)果、積累與回憶
應(yīng)用自然不能在交互結(jié)束后戛然而止,如何讓用戶在AR體驗中得到獎勵和收獲,并且在不方便使用AR功能時也能通過過去積累的數(shù)值、收集的戰(zhàn)利品相互比較和炫耀,是產(chǎn)品設(shè)計時需要考慮的問題,總之最終要從AR的世界,再次回到應(yīng)用的世界,這里就不再詳述了。
結(jié)語
談到這里,我們已經(jīng)從技術(shù)到用戶,從用戶到產(chǎn)品大概分析了一遍,而要得出針對具體領(lǐng)域明確的AR產(chǎn)品的設(shè)計方法,還是只能靠我們在實踐中根據(jù)情況仔細(xì)思考和嘗試。增強現(xiàn)實技術(shù)和它的相關(guān)硬件雖然還不夠完善,但科技發(fā)展一直就那么的突飛猛進,逼著我們一方面需要保持對技術(shù)的持續(xù)關(guān)注,迎接一個個新特性和功能的到來,另一方面還必須保持更深入的思考,抓住技術(shù)背后不變的東西,才能以不變應(yīng)萬變。
從古至今,現(xiàn)實負(fù)責(zé)讓我們無奈,娛樂負(fù)責(zé)讓我們開心,但通過增強現(xiàn)實和相關(guān)技術(shù),游戲和娛樂將會越來越多的來到現(xiàn)實里,讓生活和工作變得充滿新奇,讓人們更加開心和方便。所以,像一個孩子一樣,張開你想象力的翅膀,重拾你的好奇心,迎接未來那個有趣的時代吧!

