AI Edge:百度新自駕車數(shù)據(jù)集 | Stack Overflow 年度調(diào)查:對(duì)AI的擔(dān)憂 | Allen AI 新的常識(shí)問答數(shù)據(jù)集秒殺傳統(tǒng)算法 | 微軟發(fā)布深度學(xué)習(xí)框架的“羅塞塔石碑”...

From Import AI
謝謝“極光火狐貍” 的贊賞,拿到過最開心的兩塊錢。 _

百度,豐田以及伯克利的研究人員組織自駕車挑戰(zhàn)賽,來自百度新推出的自駕車數(shù)據(jù)集:

... ApolloScape 增加了中國自駕車研究人員的數(shù)據(jù),另外百度說它已加入伯克利的 DeepDrive 自駕車 AI 聯(lián)盟......

一個(gè)新的競(jìng)賽和數(shù)據(jù)集可能會(huì)給研究人員提供更好的方法來測(cè)試自駕車 AI 的功能和進(jìn)展。

數(shù)據(jù)集

來自百度的 ApolloScape 數(shù)據(jù)集包含將近 200,000 張RGB圖像,并有相應(yīng)的逐像素語義注釋。每一幀都有來自25個(gè)語義類的標(biāo)注,包括:汽車,摩托車,人行道,交通錐,垃圾桶,植被等等。每幅圖像的分辨率均為3384 x 2710,每幀間隔一米距離。截至2018年3月8日,已有8萬張圖片。

更多信息Many of the researchers linked to ApolloScape will betalking at a session on autonomous cars at the IEEE Intelligent VehiclesSymposium in China

競(jìng)賽

新的 WAD 比賽將給人們測(cè)試和開發(fā) ApolloScape 和 Berkeley DeepDrive (DeepDrive 數(shù)據(jù)集包含100,000個(gè)視頻剪輯,每個(gè)視頻剪輯大約40秒長,有一個(gè)關(guān)鍵幀得到標(biāo)注) 的數(shù)據(jù)集上的AI 系統(tǒng)的機(jī)會(huì)。獎(jiǎng)金大約為10,000美元,研究人員正在征集有關(guān)研究技術(shù)的論文:可駕駛區(qū)域分割(drivable area segmentation 能夠找出場(chǎng)景的區(qū)域?qū)?yīng)哪些標(biāo)簽,以及哪些區(qū)域安全); 道路物體檢測(cè)(找出路上的東西); 學(xué)習(xí)從一個(gè)語義領(lǐng)域遷移到另一個(gè)語義領(lǐng)域,特別是從Berkeley數(shù)據(jù)集(在美國加利福尼亞州拍攝)的訓(xùn)練到 ApolloScape 數(shù)據(jù)集(在中國北京拍攝)。 更多: 關(guān)于'WAD'比賽

面對(duì)100,000+開發(fā)人員的調(diào)查顯示對(duì) AI 的擔(dān)憂

......開發(fā)人員認(rèn)為危險(xiǎn)和令人興奮的,以及誰該負(fù)責(zé)......

開發(fā)者社區(qū) StackOverflow 發(fā)布了其社區(qū)年度調(diào)查結(jié)果,今年它問到了AI:

  • 開發(fā)人員認(rèn)為“危險(xiǎn)”的

    提高工作自動(dòng)化程度(40.8%)

  • 開發(fā)人員認(rèn)為“令人興奮”的

    人工智能超越人類智能,也就是奇點(diǎn) (Singularity)(28%)

奇點(diǎn)理論,一個(gè)根據(jù)技術(shù)發(fā)展史總結(jié)出的觀點(diǎn),認(rèn)為未來將要發(fā)生一件不可避免的事件──技術(shù)發(fā)展將會(huì)在很短的時(shí)間內(nèi)發(fā)生極大而接近于無限的進(jìn)步

  • 誰需要考慮AI的后果:

    • 開發(fā)人員或創(chuàng)建AI的人員:47.8%

    • 政府或其他監(jiān)管機(jī)構(gòu):27.9%

  • 不同的角色=不同的擔(dān)憂

    技術(shù)專家們更傾向于說,比起奇點(diǎn)問題他們更關(guān)心公平問題,而設(shè)計(jì)師和移動(dòng)開發(fā)人員傾向于更關(guān)心奇點(diǎn)。

閱讀更多:開發(fā)者調(diào)查結(jié)果2018年(StackOverFlow)。

Allen AI 用新的常識(shí)問答數(shù)據(jù)集來讓現(xiàn)在的算法跪一地:

...常識(shí)問題旨在挑戰(zhàn)和挫敗當(dāng)今最優(yōu)秀的算法...

在宣布了1.25億美元的融資,還有如何致力于開展推動(dòng) AI 處理常識(shí)方面的研究后,艾倫人工智能研究所 (Allen Institute for Artificial Intelligence,簡稱AI2) 發(fā)布了一項(xiàng)新的 ARC 挑戰(zhàn)和數(shù)據(jù)集,研究人員可以用其開發(fā)更智能的算法。

數(shù)據(jù)集

主要的 ARC 測(cè)試包含 7787 個(gè)自然科學(xué)問題,分為一組簡單集和一組困難集。困難集是那些用基于檢索的和詞語共現(xiàn)算法不能正確回答的問題。同時(shí),AI2 正在發(fā)布“ARC語料庫”,其收集了1400萬篇與ARC相關(guān)知識(shí)的科學(xué)相關(guān)句,以支持 ARC 算法的開發(fā)。這個(gè)語料庫包含與95%挑戰(zhàn)問題相關(guān)的知識(shí)。

神經(jīng)網(wǎng)絡(luò)基線模型

AI2還發(fā)布了三個(gè)基線模型,這些模型已經(jīng)在挑戰(zhàn)中進(jìn)行了測(cè)試,在簡單集中取得了一些成功,但卻不能比困難集中的隨機(jī)選擇更好。這些模型包括 decomposable attention model(DecompAttn),Bidirectional Attention Flow(BiDAF)和 decomposed graph entailment model(DGEM)。

ARC中的問題旨在測(cè)試從定義到空間到代數(shù)知識(shí)的所有內(nèi)容,鼓勵(lì)使用能夠抽象和概括大數(shù)據(jù)語料庫概念的系統(tǒng)。

基線結(jié)果

ARC非常具有挑戰(zhàn)性:AI2 以其神經(jīng)網(wǎng)絡(luò)方法為基準(zhǔn)發(fā)現(xiàn),簡單問題的分?jǐn)?shù)最高只為60%,更具挑戰(zhàn)性的問題的分?jǐn)?shù)最高只有27%

示例問題

“通過觀察它可以確定哪種礦物性質(zhì)?

(A)光澤[正確](B)質(zhì)量(C)重量(D)硬度”。

SQUAD 接班人

ARC 可能是斯坦福問答數(shù)據(jù)集(SQUAD)和挑戰(zhàn)的可行繼任者; SQuAD 競(jìng)賽最近取得了一系列里程碑似的成果,從微軟到阿里巴巴的再到科大訊飛都在開發(fā) SQUAD 的解決方案,這些解決方案的表現(xiàn)接近人的表現(xiàn)(ExactMatch 為82%,F(xiàn)1為91%)。

對(duì) SQUAD 主題領(lǐng)域的深入評(píng)估讓我們更直觀地了解,為什么這個(gè)測(cè)試的分?jǐn)?shù)比 ARC 高得多 - 簡而言之,SQUAD更容易些; 它將大量信息豐富的文本與諸如“大多數(shù)教師從哪里獲得憑據(jù)?”等基本問題放在一起??梢詮奈谋局芯蜋z索到,而不需要太多抽象。

為什么很重要

“我們發(fā)現(xiàn)所有測(cè)試的基線系統(tǒng)在挑戰(zhàn)集中都不會(huì)超出隨機(jī)基線,包括兩個(gè)在 SNLI 和 SQuAD 上具有高性能的神經(jīng)模型,” 研究人員寫道?,F(xiàn)在最大的問題是這個(gè)數(shù)據(jù)集在 Goldilocks 系譜上的位置 - 這是否太容易(請(qǐng)參考Facebook的早期記憶網(wǎng)絡(luò)的測(cè)試)或太難或恰到好處?如果一個(gè)系統(tǒng)在ARC的更具挑戰(zhàn)性的問題上得到75%左右的話,這似乎意味著理解和知識(shí)表示向前重要的一大步呢。

更多Think you have Solved Question Answering? Try ARC, theAI2 Reasoning Challenge (Arxiv).

更多SQuAD: 100,000+ Questions for Machine Comprehension ofText (Arxiv)

微軟發(fā)布深度學(xué)習(xí)框架的“羅塞塔石碑”:

羅塞塔石碑,Rosetta Stone.

原本只是一塊刻有古埃及法老托勒密五世詔書的石碑,石碑上用希臘文字、古埃及文字和當(dāng)時(shí)的通俗體文字刻了同樣的內(nèi)容,這使得近代的考古學(xué)家得以有機(jī)會(huì)對(duì)照各語言版本的內(nèi)容后,解讀出已經(jīng)失傳千余年的埃及象形文之意義與結(jié)構(gòu),而成為今日研究古埃及歷史的重要里程碑。之后也指代類似的事物。

... GitHub repo為您提供以下幾種不同方式顯示的基本操作...

微軟發(fā)布了一個(gè)GitHub倉庫,其中包含了Caffe2,Chainer,CNTK,Gluon,Keras(后端CNTK / TensorFlow / Theano),Tensorflow,Lasagna,MXNet,PyTorch 和 Julia-Knet 等各個(gè)框架。 這里的想法是,如果你在其中一個(gè)框架中閱讀一種算法,則可以使用這個(gè)算法來了解其他框架。

“我們今天發(fā)布的完整版本就像是一個(gè)深度學(xué)習(xí)框架的Rosetta Stone,展示了在不同框架中的模型構(gòu)建端到端過程,” 研究人員在一篇博文中寫道,該文章還提供了一些粗略的CNN和RNN的基準(zhǔn)訓(xùn)練時(shí)間。

閱讀更多Comparing Deep Learning Frameworks: A Rosetta StoneApproach (Microsoft Tech Net).代碼(Github)

進(jìn)化算法對(duì) AI 設(shè)計(jì)的奇怪,美妙,而又潛在的危險(xiǎn)影響:

[圖片上傳失敗...(image-e41654-1521681038341)]

...為什么AI安全社群可以從進(jìn)化中學(xué)習(xí)...

一個(gè)國際研究人員組成的聯(lián)盟發(fā)布了一些奇怪且經(jīng)常有趣的發(fā)現(xiàn),其中進(jìn)化算法對(duì)其被要求解決的任務(wù),找出了一些讓人大跌眼鏡的解決方案和技巧。該論文包含了一系列很有啟發(fā)性的例子,其中算法顛覆了人類觀察者的預(yù)期,其中包括:

  • 機(jī)會(huì)主義的空翻:當(dāng)試圖讓生物進(jìn)化進(jìn)行跳躍時(shí),一些智能體發(fā)現(xiàn)他們可以演變非常高的身體,然后空翻,獲得與地面距離成比例的獎(jiǎng)勵(lì)。

  • 毫無意義的程序:當(dāng)研究人員試圖用GenProg 來進(jìn)化代碼以解決一個(gè)錯(cuò)誤的數(shù)據(jù)排序程序時(shí),GenProg 進(jìn)化出了一個(gè)解決方案:該程序會(huì)返回一個(gè)空列表,因?yàn)榭樟斜聿荒鼙挥?jì)為負(fù)值因?yàn)樗话魏蝺?nèi)容。

  • 物理學(xué)黑客:一個(gè)機(jī)器人計(jì)算出正確的振動(dòng)頻率,以利用在物理模擬器的地板上發(fā)現(xiàn)摩擦bug,讓它通過bug在地面上推動(dòng)自身。

  • 進(jìn)化總能找到出路:另一種類型的錯(cuò)誤是即使研究人員認(rèn)為這種方式是不可能的,進(jìn)化也可能成功,就像一個(gè)六腿機(jī)器人能夠在腳不接觸地面的情況下快速行走一樣(謎底揭曉:它翻轉(zhuǎn)過來背靠地面,并用腿的運(yùn)動(dòng)來推動(dòng)自己)。

  • 還有很多很多

研究人員認(rèn)為,進(jìn)化也可能反應(yīng) AI 安全中一些令人不安的問題。研究人員寫道:“數(shù)字化進(jìn)化中令人驚訝的創(chuàng)造性也具有其他跨領(lǐng)域的影響。例如,本文中”瘋狂選擇“的很多例子都與 AI 安全這樣的新興領(lǐng)域相關(guān)。 “因此,這些小故事可以充當(dāng)進(jìn)化的證據(jù) - 無論是生物的還是計(jì)算的 - 都有內(nèi)在的創(chuàng)造性,并且應(yīng)該經(jīng)常會(huì)是讓人驚訝,高興,甚至強(qiáng)過我們?!?/p>

更多The Surprising Creativity of Digital Evolution: ACollection of Anecdotes from the Evolutionary Computation and Artificial LifeResearch Communities (Arxiv).

自從有了神經(jīng)教練們,我們的 AI 性能也提高啦:

... 也就是,為什么我這有多名專家老師指導(dǎo)的小學(xué)生能打敗你那有更大資源但沒老師的高中生......

DeepMind 的研究展示了,如何通過傳輸預(yù)先訓(xùn)練的“教師”智能體的知識(shí),來提高特定智能體對(duì)某項(xiàng)任務(wù)的績效。該技術(shù)在訓(xùn)練 AI 智能體方面產(chǎn)生了顯著的加速效應(yīng),并有些證據(jù)表明,被教授的智能體獲得比沒教的智能更高的性能。

該技術(shù)有兩個(gè)變種:單師和多師; 如預(yù)期的那樣,通過多名教師進(jìn)行過預(yù)訓(xùn)練的代理比單一訓(xùn)練的代理要更好。

奇怪而微妙

這種方法有一些特點(diǎn)對(duì)開發(fā)更復(fù)雜的 AI 智能體似乎有幫助:在一項(xiàng)任務(wù)中,DeepMind 用智能體測(cè)試如何用短期記憶來獲得高分時(shí)。 '小'智能體(只有兩個(gè)卷積層)通常無法學(xué)會(huì)使用記憶,因此也就無法達(dá)到某個(gè)闕值以上的分?jǐn)?shù),但通過與多位專業(yè)老師一起訓(xùn)練后的'小'智能體,卻可以完成任務(wù)。

“這很讓人驚訝,因?yàn)?Kickstarting 機(jī)制只能指導(dǎo)學(xué)生智能體采取哪個(gè)行動(dòng):它不會(huì)規(guī)定學(xué)生如何構(gòu)建其內(nèi)部記憶狀態(tài)然而,學(xué)生只能通過記住下一輪開始前的信息來預(yù)測(cè)教師的行為,這對(duì)短期記憶的形成似乎是強(qiáng)大的監(jiān)督信號(hào),我們發(fā)現(xiàn)這與最好的人類教育者的教導(dǎo)方式非常相似:不告訴學(xué)生去想什么,而是簡單地讓學(xué)生在豐富的學(xué)習(xí)環(huán)境中為自己學(xué)習(xí)。“ 研究人員寫道。

為什么很重要

像這樣的趨勢(shì)表明,科學(xué)家可以通過使用這種預(yù)先訓(xùn)練的技術(shù)來更好地評(píng)估新代理,從而加快自己的研究。這進(jìn)一步證實(shí)了 AI 研究的關(guān)鍵輸入將從預(yù)先標(biāo)記的靜態(tài)數(shù)據(jù)集轉(zhuǎn)為計(jì)算。盡管應(yīng)該指出,這里的數(shù)據(jù)隱含在研究人員可訪問的程序性、可修改的模擬器形式中。更具推測(cè)性的是,這意味著可以使用教師混合訓(xùn)練復(fù)雜的智能體,這些智能體的能力遠(yuǎn)遠(yuǎn)超過其任何一位先輩的能力。

更多:Kickstarting Deep Reinforcement Learning (Arxiv).

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容