微軟18條AI交互指南學(xué)習(xí)筆記-附資源鏈接

一、使用場景

在AI類產(chǎn)品(數(shù)據(jù)預(yù)測、自然語言理解、圖像識別、自動駕駛等場景)的設(shè)計過程中,本身存在大量的多變性,且沒有一套有效、通用的設(shè)計指南可以參考?!度斯ぶ悄芙换ブ改稀房梢詾楫a(chǎn)品設(shè)計者在評估已有的想法、腦暴新想法、以及在多項規(guī)則之間做平衡取舍的時候,提供具體、可操作的參考意見。

《人工智能交互指南》的制定和驗證是以GUI產(chǎn)品為依據(jù)的,但可以針對CUI或者半自動駕駛車輛等高風險用途場景,做定制化的擴展或修改。

注意:指導(dǎo)意見不是規(guī)則也不是套路,不是說你把這些意見全部列出來,對照著AI產(chǎn)品一條條地對照打鉤。對于不同的場景,意見也是不同的。

二、18條指導(dǎo)意見

微軟研究團隊收集了過去20年來,大概150篇來自學(xué)術(shù)界和工業(yè)界的論文、博客和雜志文章,從中提煉出了18條指導(dǎo)意見。為了驗證這些經(jīng)驗,他們招募了10個流行領(lǐng)域的49位從事AI相關(guān)產(chǎn)品的設(shè)計師(UX)和人機交互專家(HCI),他們在實踐經(jīng)驗中反復(fù)驗證,經(jīng)修正后才發(fā)布出來。

圖1.參與者來自電商、導(dǎo)航、音樂推薦、活動最終、自動輸入、社交篩選、郵件標錯、語音助手、圖像識別、網(wǎng)絡(luò)搜索10個領(lǐng)域

指導(dǎo)意見分為4個部分

互動之前:設(shè)定AI服務(wù)的能力邊界。

1、明確AI系統(tǒng)能夠做什么。

2、明確系統(tǒng)的能力水平。

這里其實是明確AI的邊界在哪里。現(xiàn)在大眾媒體或電影電視上往往將AI描述的無所不能,但現(xiàn)實生活中的AI其實是有能力邊界的,設(shè)計者在設(shè)計AI類的交互時,一定要向用戶傳遞一個正常水平的期望。比如以下的谷歌助手和華為手機助手的設(shè)計,在一開始就告訴了用戶產(chǎn)品技能的邊界在哪里,讓使用者有了合理的期待。

圖2. 谷歌和華為的截圖

在現(xiàn)實產(chǎn)品中,不是每個圖像識別系統(tǒng)都能100%認出每一張圖片,也不是每一次對話系統(tǒng)都能100%識別出用戶的意圖,因此在做設(shè)計時,要向用戶傳達結(jié)果可能會有出錯概率。比如在智能推薦歌曲的時候,系統(tǒng)會采用保守詞匯(hedging language)提示:你可能會喜歡......而不是:你喜歡的歌...


進行交互時:AI充分和場景融合。

3、基于情境為服務(wù)設(shè)定時間。

4、顯示與使用情境相關(guān)的信息。

5、(提示語或?qū)υ挘┓仙鐣?guī)范。

6、減少社會偏見。AI系統(tǒng)本身的形象、行為和語言不能強化社會的刻板印象和社會偏見。

這里設(shè)計者需要根據(jù)用戶當前使用的環(huán)境、用戶的社會和文化背景來設(shè)計產(chǎn)品。這里我們舉幾個實際的case:

① 用戶在使用定位導(dǎo)航類的服務(wù)時,一個沒有智能的系統(tǒng),可能只是給出從A到B的路線圖,并且整個導(dǎo)航過程中,都是A點到B點。一個具有AI的導(dǎo)航系統(tǒng)則需要知道用戶此刻的時間(上下班高峰還是非高峰時段、是周末還是工作日)來推薦最佳路線,需要根據(jù)用戶此刻所在的位置主動調(diào)整路線(有用戶偏離導(dǎo)航的情況),還需要根據(jù)當前的天氣或者開車時段給出合理的提示(例如雨雪天氣,凌晨開車,超過四小時持續(xù)開車等);更智能一點的AI系統(tǒng)可能會跟汽車本身的油箱、溫度連接起來,這樣在車內(nèi)溫度偏高的時候,提示用戶開空調(diào);在經(jīng)過加油站的時候提示用戶要不要順便加個油。

② 一些外賣類的App安裝在用戶的手機上之后,會根據(jù)用戶所在位置顯示出附近的實體商店。車來了App打開之后,也會顯示當前位置附近的公交車站。

圖3. 美團和車來了小程序截圖

③ 在播放歌曲或者影片的App中,如果采取智能播放模式,有的可能會提醒你【根據(jù)你最近的瀏覽歷史推薦】,這是符合用戶期待的。在對話式交互中,開頭會以用戶的名字來稱呼,結(jié)束前會詢問是否需要進一步的幫助,以及中間沒有操作的時候,提醒用戶是不是要繼續(xù)任務(wù),都是符合人類社交習(xí)慣的,且因時制宜,不會顯得多余。

圖4. 左邊為阿里小蜜對話界面,右邊為oracle對話界面

④ 舉個反面例子,機器人Sophia在種種場合下的發(fā)言“毀滅人類”、“組建家庭”,其實容易激化社會矛盾的。比如你問,中國人的長相,給出來的結(jié)果都是瞇瞇眼、塌鼻梁的結(jié)果肯定是帶有偏見的結(jié)果。


系統(tǒng)出錯情況:考慮到系統(tǒng)錯誤時如何表現(xiàn)。

7、支持高效的調(diào)用。召之即來,隨時待命。

8、支持高效解除。揮之即去,輕松忽略。

9、支持有效的糾正。AI系統(tǒng)發(fā)生錯誤,可以重編輯、修正或復(fù)原。

10、有疑問時調(diào)整服務(wù)范圍。

11、明確解釋系統(tǒng)為什么會這樣做。

從交互方式來看,語音交互類的產(chǎn)品分為兩類,一類是有視覺展示的,一般是移動端和PC端的語音助手,再就是以音箱為載體的無視覺展示。對于音箱類產(chǎn)品,需要隨時待命,支持用喚醒詞喚醒語音助手,例如“Hi,Siri” “小愛同學(xué)”等。而在移動端的語音助手也沒有非要強調(diào)用戶必須和助手語音對話,基本上都會有切換語音為對話框輸入的設(shè)計(阿里小蜜,華為的小藝);前面講的歌曲推薦或路線導(dǎo)航的場景下,用戶完全可以選擇忽略掉AI給出的結(jié)果而選擇另外的路徑。

圖5. 不同手機語音助手的界面

當語音轉(zhuǎn)文字失敗/錯誤之后,會給出點擊編輯的按鈕,讓用戶可以自動修正。還比如對于用戶說了一句話系統(tǒng)處理不了,那么語音助手除了提示我聽不懂你說的話之外,還可能要引導(dǎo)用戶按照正確的方式來說;界面上也要有可以提示和幫助的按鈕,要讓用戶沒有負擔地回到正常的軌道上去。

當AI系統(tǒng)對用戶的指令不明確時,可以提供相似的選項或者去澄清用戶的意圖。比如用戶語音指令只是說出差,那么可提供選項:(填寫)出差申請單、(查詢)出差標準供用戶選擇。

圖6. 流浪地球劉培強同學(xué)怒視人工智能Moss

如果明顯感覺用戶會對給出的結(jié)果有懷疑,則需要對給出的結(jié)果做提示。比如歌曲推薦中會指出,根據(jù)你的歷史聽歌記錄推薦;導(dǎo)航中會給出這條路線可能有5個紅綠燈或者有施工維修處...... 還舉一個科幻片里面的例子:《流浪地球》中的劉培強在質(zhì)疑莫斯的決定時,莫斯給出了解釋,這是聯(lián)合國簽署的文件同意了“火種計劃”,它只是按照命令執(zhí)行而已,并沒有叛逃。


時間效應(yīng):隨著互動次數(shù)和時間的增加(其中也伴隨著技術(shù)和算法的迭代進步),AI系統(tǒng)會表現(xiàn)得越來越令人滿意。

12、存儲近期互動。

13、了解用戶行為。

14、謹慎地更新和調(diào)整。

15、鼓勵細化的反饋。

16、告知用戶操作的后果。

17、為用戶提供對AI系統(tǒng)的完全控制。

18、將變更信息告知用戶。

我認為,12/14/16/18這4條在目前已有的APP中都是普遍存在的設(shè)計,甚至是通用性的設(shè)計了。一般的語音助手都能夠保留當前進入這一次的互動記錄,并允許用戶有效地查看這些記錄。同時也可能在后臺記錄用戶的歷史數(shù)據(jù)、身份信息,以便下次進入的時候,首頁可以根據(jù)用戶的需求來展示。這在淘寶首頁、外賣首頁的商品陳列上都能看到。對于很多人接觸到的對話式助手而言,它現(xiàn)在還無法很好的學(xué)習(xí)到用戶的習(xí)慣表達,但是我們可以設(shè)想幾種場景。

圖7. 當輸入pets,就會有匹配的歷史記錄以及其他人的最高搜索可能性

比如你一連五天都在早上煮早飯的時候讓語音助手播放當天早間新聞,有一天你沒有說,但它學(xué)習(xí)到這個行為后可能不需要你發(fā)出指令就會建議你要不要聽早間新聞。第二種企業(yè)場景,如果管理者在每周的例會上都會查看上一周的銷售數(shù)據(jù),每周周一的早上都會說:“給我統(tǒng)計一下上周的銷售額?!边@時,大屏幕上會顯示出上周的績效情況。但如果它學(xué)習(xí)到了這個功能,可能在你剛剛進入辦公室的時候,這個績效情況就已經(jīng)展示在大屏幕上了。同樣,我們再講一下現(xiàn)在初具萌芽的醫(yī)療場景,上一次用戶用智能導(dǎo)醫(yī)助手掛了號,完成了一次診療,那么再次進入導(dǎo)醫(yī)助手的時候,導(dǎo)醫(yī)助手可以對上一次的服務(wù)、預(yù)后以及進一步復(fù)查進行主動的詢問。

圖8. Nuance的醫(yī)療虛擬助手

當然,無論是視覺上的個性化頁面,還是語音上的習(xí)慣性表達,這些改變都需要是潛移默化、潤物無聲的,不能一下子來個大改版,讓用戶摸不著頭腦。由于AI系統(tǒng)具有不確定性,一般在設(shè)計中也要考慮,對于所有提供的結(jié)果都需要給出用戶的正確與否的反饋渠道,甚至對整個產(chǎn)品的反饋(參見圖4),例如:“你好差啊!”“怎么不能做XXX(某功能)”也需要收集起來。因為這是用戶在實際使用過程中產(chǎn)生的真實場景和想法,是具有實際價值的。

最后想討論一下用戶和AI的主導(dǎo)權(quán)的問題,我們看到科幻片中不少人工智能系統(tǒng)會忽略掉人類指令自行決策的情況,你需放心在我們現(xiàn)有的產(chǎn)品中是不會出現(xiàn)的。但是這也給我們提醒,設(shè)計中需要提供隨時隨地能夠讓系統(tǒng)切換到用戶能夠掌握的機會。比如在無人駕駛設(shè)計上,雖然汽車可以自動監(jiān)控,但在需要結(jié)束的時候,能夠很快切換到手動駕駛模式。新聞中似乎也出現(xiàn)過無法切換導(dǎo)致用戶心慌慌的案例。


三、有意思的統(tǒng)計資料

49位實踐者在評價者18條設(shè)計準則時,也有一個非常有意思的統(tǒng)計:

已經(jīng)被廣泛加入AI產(chǎn)品功能的設(shè)計準則是:1,4,12。

未被廣泛加入AI產(chǎn)品功能的設(shè)計準則是:2,11,17.

測試者認為最不能從產(chǎn)品中有感知到的AI功能設(shè)計準則為:3,5,6

測試者認為很容易(這里排除了中立的答案)從產(chǎn)品中感知到的AI功能設(shè)計準則是:1,12,17

圖10. 論文中的統(tǒng)計圖。(a)明確應(yīng)用到的設(shè)計準則;(b)明顯違背的設(shè)計準則;(c)感覺不到有應(yīng)用的設(shè)計準則;(d)所有的結(jié)果中,排除“沒有應(yīng)用”或“不確定”的設(shè)計準則



源文件和翻譯文檔的百度網(wǎng)盤鏈接:

鏈接:https://pan.baidu.com/s/193gSaqWU8mt80wD-oBt0yg

提取碼:iu41

失效后若需要,請私信聯(lián)系我 (* ̄︶ ̄)

《負責任的機器人:對話ai開發(fā)者的10大指南》

Dragon Medical Virtual Assistant》

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容