AI Edge: 如何面對AI濫用的問題 | 未來機器人可能會被用作行人的減速帶 | 用強化學(xué)習(xí)向你發(fā)送一輛自駕車 | AI大佬們的Reddit AMA 答題大會...

From Import AI

本期編輯小D非常給力,很用心的完成自己那部分的翻譯。

希望再接再厲,一起加油 _

緊急問題

如何面對AI的惡意使用:

當好人們天真地開源了AI系統(tǒng)時,壞人們卻可能通過修改它,將好的AI轉(zhuǎn)化為不好的AI...

人工智能,特別是深度學(xué)習(xí),是種非常強大且有效的技術(shù)。這使得一些不懷好意的人可能會將其用于壞的用途。這基本上是所有重要技術(shù)需注意的:斧頭可用于砍樹也可以用來砍頭,電可以照亮家中也可以電死人,實驗室工作臺可用于做療藥也可以用來做毒藥...。

但與這些不同的是,AI還有些很危險的特性:即 Rodney Brooks 過去用來描述機器人的一句話:“快速,廉價,失控”。如今的AI系統(tǒng)運行在通用硬件上,大都可以用開源軟件來實現(xiàn),同時隨著底層算法和計算力的進步可以看到性能的顯著提高。

這些大家都是能夠直接接觸的,這意味著該技術(shù)有可能在做出巨大貢獻同時,造成巨大的傷害。目前AI社區(qū)幾乎讓所有東西變成公開,雖然今天這看起來還是合理的,但未來可能就會變成大的危害,因為摩爾定律還有算法的進步(這意味著個人用更少的計算資源就能訓(xùn)練一個AI系統(tǒng)了)。

萬用警報

AI不僅僅是一種“兩用”技術(shù),而是一種萬金油的技術(shù)。意味著目前搞清如何管理它,以防止壞人做壞事(大多數(shù)情況下)還很難做到。相反,更需要探索新的治理制度,社區(qū)規(guī)范,信息共享標準等等。

101頁的問題報告

如果您有興趣深入了解這個問題,請查看眾多研究人員花了去年一年時間制作的報告:The Malicious Use of Artificial Intelligence: Forecasting, Prevention, and Mitigation (Arxiv)。還可以通過這篇OpenAI的博文查看摘要。

百度可以通過少數(shù)樣本克隆你的聲音:

...真相只有一個...

百度研究所訓(xùn)練出了一種AI系統(tǒng),可以通過少量的單人聲音樣本,微調(diào)神經(jīng)網(wǎng)絡(luò)然后輸出聽起來就像是這個人的聲音。這種系統(tǒng)可能會非常強大,尤其是創(chuàng)建適用于多口音的多用戶AI服務(wù)時。

然而細思極恐,如果它的性能變得非常好的話,那我們對聲音的信任將會完全喪失。可幸的是,現(xiàn)在克隆語音的能力仍然有很大的不足,最好的系統(tǒng)也需要一百個不同的語音樣本,而且聽起來就像是從井底發(fā)出的聲音,所以離我們真正遇到問題還有一段距離 - 但也要記住它們即將到來。

意味著什么

這意味著將來不懷好意者可以將你的聲音錄下來,然后用文本到語音生成現(xiàn)成的對話。一旦這個時代到來,那么對聲音的信任還有一個人的聲音樣本價值將會完全改變。

結(jié)果:為了更好地了解結(jié)果,可以聽聽這個示例(聲音克?。喊俣龋?/a>。
更多
Neural Voice Cloning with a Few Samples (Baidu Blog).

為何未來機器人可能會被用作行人的減速帶:

...研究人員展示了人們在巡邏機器人面前放慢腳步...

新澤西州霍博肯市史蒂文斯理工學(xué)院電氣與計算機工程系的研究人員已經(jīng)研究過人群對機器人的反應(yīng)。他們?yōu)樘骄繖C器人輔助行人流量調(diào)節(jié),在出口處設(shè)置的被動式人機交互(HRI)的研究。

結(jié)果:

“我們的實驗結(jié)果表明,在出口通道環(huán)境中,機器人在與單向行人流垂直的方向上移動會減慢單向流動速度,機器人移動得越快, 平均行人速度變得更快,而且,當人們以更快的速度行走時,機器人對行人速度的影響更為顯著,”他們寫道。 換句話說:行人會避免一個笨拙的機器人在他們面前移動。

方法:

為了進行實驗,研究人員使用定制的“Adept Pioneer P3-DX移動機器人”,它的程序被編程為以不同的速度垂直于行人流方向移動。為了收集數(shù)據(jù),他們在房間內(nèi)配備了五個Microsoft Kinect 3D傳感器進行行人探測以及通過OpenPTrack進行追蹤。

意味:

由于低成本化的傳感器和硬件平臺的激增,機器人變得便宜,人們很可能會將更多的機器人部署到現(xiàn)實世界中。 弄清楚這些非常愚笨的非反應(yīng)式機器人如何變得有用,將進一步推動這些技術(shù)的應(yīng)用,并增加經(jīng)濟規(guī)模以進一步降低硬件平臺的成本并增加技術(shù)的推廣。 基于這項研究,您可能會期待未來的機場和交通系統(tǒng),在擁擠的路線上擠滿了機器人往返穿梭,通過自動化機器人施加隱性的人群速度控制。

更多: Pedestrian-Robot Interaction Experiments in an Exit Corridor (Arxiv).

茶杯和AI:

... Google Brain的Eric Jang通過短篇故事解釋了AI的難度...

你如何定義一個茶杯? 這是一個棘手的問題。 而且,越多嘗試通過特定的視覺屬性來定義它,就越有可能提供一種受到限制的狹義描述,或者遇到一個遲鈍的讀者。這些是Eric Jang在嘗試定義茶杯這個有趣的小故事中探索的一些問題。

更多:
Teacup (Eric Jang, Blogspot.)

為什么在強化學(xué)習(xí)的幫助下,可以向你發(fā)送一輛自駕車?

...合作的研究人員與中國著騎行巨頭滴滴出行合作,為了策略性車輛分配,模擬和測試RL算法...

來自中國騎行巨頭滴滴 出行和密歇根州立大學(xué)的研究人員發(fā)表了關(guān)于使用強化學(xué)習(xí)來更好地管理跨給定城市區(qū)域的車輛分配的研究。 研究人員提出了兩種算法來解決這個問題:contextual multi-agent actor-critic (cA2C)
contextual deep Q-learning (cDQN)

這兩種算法都實施了調(diào)整,考慮地理禁區(qū)(如湖泊)以及其他協(xié)作智能體的存在。 算法的獎勵功能是“通過將可用車輛重新定位,需供差距大于當前位置的地點,使平臺的總商品量(GMV:所有訂單的價值)最大化”。

數(shù)據(jù)集和環(huán)境:

研究人員在一個定制設(shè)計的大規(guī)模電網(wǎng)世界中測試他們的算法,這個世界充滿了來自滴滴出行車隊管理系統(tǒng)的真實數(shù)據(jù)。 這些數(shù)據(jù)連續(xù)四周的中國成都的游樂設(shè)施,包括訂單價格,出發(fā)地,目的地和時間等信息,以及真實滴滴車輛的軌跡和狀態(tài)。

結(jié)果:
研究人員通過模擬過去真實的情景來測試他們的方法,而不需要車隊管理; 包括T-SARSA,DQN,Value-Iteration等一系列不同的技術(shù); 然后通過實施基于RL的方法。CDQN和c2A2C的回報率高于所有基準線,其表現(xiàn)略高于(即略高于統(tǒng)計誤差閾值)存量DQN。

為什么重要:

歡迎來到平臺資本主義的新時代,在這個時代,GPU以最高速度嗡嗡作響,模擬替代版的商業(yè)世界。 雖然本文中的結(jié)果并不特別令人驚訝,但它們表明了未來平臺公司將如何接近AI系統(tǒng)的部署:盡可能多地收集數(shù)據(jù),構(gòu)建一個基本模擬器,以便將實際數(shù)據(jù)插入,然后大力測試AI算法。 這表明,平臺越大,數(shù)據(jù)和計算資源就越能夠承受越來越高的保真度模擬; 所有的事情都是平等的,誰能夠建立最高效和準確的模擬器就將可能是他們在市場上最好的競爭對手。

更多: Efficient Large-Scale Fleet Management via Multi-Agent Deep Reinforcement Learning (Arxiv).

CMU研究人員為改善端到端的SLAM,添加了“注意力”:

image

...離神經(jīng)SLAM的夢想越來越近...

卡內(nèi)基梅隆大學(xué)和蘋果公司的研究人員已經(jīng)發(fā)布了關(guān)于神經(jīng)圖優(yōu)化器的細節(jié)。神經(jīng)圖優(yōu)化器是針對穿越在世界各地中的智能體同時定位和映射(SLAM)這一常年棘手的問題的神經(jīng)方法。任何渴望在現(xiàn)實世界中做出有用的東西的系統(tǒng)都需要有SLAM功能。

今天,神經(jīng)網(wǎng)絡(luò)SLAM技術(shù)可以解決日常生活中遇到的問題,如錯誤的傳感器校準和異常的亮度變化。所提出的神經(jīng)圖優(yōu)化器系統(tǒng)由多個專用模塊組成,以處理不同的SLAM問題,但每個模塊都是可區(qū)分的,因此整個系統(tǒng)可以進行端對端培訓(xùn) - 這是一個理想的命題,因為這可以縮短測試,實驗,并迭代這些系統(tǒng)所需的時間。不同的模塊處理從局部估計(基于當?shù)厍榫车牡胤剑┑饺蚬烙嫞谌澜绲哪膫€位置)的問題的不同方面,并納入基于注意力機制的技術(shù)來幫助自動糾正訓(xùn)練期間產(chǎn)生的錯誤。

結(jié)果:
研究人員測試該系統(tǒng)是否能夠在2D網(wǎng)格迷宮中導(dǎo)航,以及基于Doom游戲引擎的更復(fù)雜的3D迷宮。 實驗表明,它能夠更好地將某物的位置映射到相對于先前系統(tǒng)的真實地面位置。

為什么它很重要:

這項技術(shù)能剔除大量手工設(shè)計的SLAM算法,并將其替換為完全學(xué)習(xí)基底,使得這樣的時代的到來變得更近。
這對于新系統(tǒng)新技術(shù)的測試和開發(fā)來說,是非常有用的,盡管它不可能在短期內(nèi)取代傳統(tǒng)的SLAM方法,因為神經(jīng)網(wǎng)絡(luò)很可能會繼續(xù)顯示他們在現(xiàn)實世界系統(tǒng)中不切實際的怪癖。

更多:
Global Pose Estimation with an Attention-based Recurrent Network (Arxiv).

AI 大佬們進行 Reddit AMA答題活動,承認了當前的難題

Image

Reddit 機器學(xué)習(xí)板塊是當前最大的英文機器學(xué)習(xí)網(wǎng)上社區(qū)。

AMA (Ask me anything 想問啥就問啥),是其中一個特殊的板塊,會定期請一些領(lǐng)域有名的人來回答大家問題。

...話說三位 AI專家走進一家網(wǎng)站...

Yann LeCun,Peter Norvig和Eric Horvitz最近在Reddit上做了一個Ask Me Anything(AMA),大家像他們提出了很多最佳AI熱帶來的問題。這個AMA值得整個都閱讀完,下面是其中的幾個亮點:

計算鴻溝是不可否認的:“我的紐約大學(xué)學(xué)生在學(xué)??梢允褂玫腉PU,就不可能像在FAIR公司實習(xí)時那么多”,Yann LeCun說。但也不要沮喪,他指出,盡管缺乏計算力,但學(xué)術(shù)界還是可能會繼續(xù)成為新技術(shù)的主要發(fā)源地,之后大公司再將其擴大規(guī)模。 “你不會去想著與大型團隊直接競爭的,這里有很多方法可以在不這樣做的情況下也可以進行卓越的研究?!?/p>

通向通用人工智能(AGI) 之路:許多問題都是關(guān)于深度學(xué)習(xí)的局限性,而且稍稍探討了可以產(chǎn)生更靈活,更強大智能體的研究途徑。

Eric Horvitz對合奏方法很感興趣**:“我們是否可以智能地將語音識別、自然語言、視覺、規(guī)劃和推理等多種能力融入智能的大型協(xié)調(diào)的”合奏“中去,并探索如何協(xié)調(diào)的這個大難題?!?/p>

Yann LeCun:“通過觀察世界來讓機器學(xué)習(xí)預(yù)測模型是AGI目前最大的障礙...... 我的預(yù)感是,大腦中有一大塊正是預(yù)測機構(gòu),它可以訓(xùn)練本身來預(yù)測任何它能預(yù)測的(從任何觀察到的變量來預(yù)測未觀察的變量,例如從過去和現(xiàn)在預(yù)測未來)。通過學(xué)習(xí)預(yù)測,大腦詳細地勾畫出了分層級的特征表示。“

更多AMA AI researchers from Facebook, Google, and Microsoft (Reddit).

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容