這些知識(shí)讓你深入了解“人工智能”

截止到21世紀(jì)前10年的后期,出現(xiàn)了一系列復(fù)興人工智能研究進(jìn)程的要素,尤其是一些核心技術(shù)。下面將對(duì)這些重要的因素和技術(shù)進(jìn)行詳細(xì)說明。

1)摩爾定律

在價(jià)格、體積不變的條件下,計(jì)算機(jī)的計(jì)算能力可以不斷增長(zhǎng)。這就是被人們所熟知的摩爾定律,它以Intel共同創(chuàng)辦人Gordon Moore命名。

Gordon Moore從各種形式的計(jì)算中獲利,包括人工智能研究人員使用的計(jì)算類型。

數(shù)年以前,先進(jìn)的系統(tǒng)設(shè)計(jì)只能在理論上成立但無法實(shí)現(xiàn),因?yàn)樗枰挠?jì)算機(jī)資源過于昂貴或者計(jì)算機(jī)無法勝任。

今天,我們已經(jīng)擁有了實(shí)現(xiàn)這些設(shè)計(jì)所需要的計(jì)算資源。舉個(gè)夢(mèng)幻般的例子,現(xiàn)在最新一代微處理器的性能是1971年第一代單片機(jī)的400萬倍。

2)大數(shù)據(jù)

得益于互聯(lián)網(wǎng)、社交媒體、移動(dòng)設(shè)備和廉價(jià)的傳感器,這個(gè)世界產(chǎn)生的數(shù)據(jù)量急劇增加。

隨著對(duì)這些數(shù)據(jù)的價(jià)值的不斷認(rèn)識(shí),用來管理和分析數(shù)據(jù)的新技術(shù)也得到了發(fā)展。大數(shù)據(jù)是人工智能發(fā)展的助推劑,這是因?yàn)橛行┤斯ぶ悄芗夹g(shù)使用統(tǒng)計(jì)模型來進(jìn)行數(shù)據(jù)的概率推算,比如圖像、文本或者語(yǔ)音,通過把這些模型暴露在數(shù)據(jù)的海洋中,使它們得到不斷優(yōu)化,或者稱之為“訓(xùn)練”——現(xiàn)在這樣的條件隨處可得。

3)互聯(lián)網(wǎng)和云計(jì)算

和大數(shù)據(jù)現(xiàn)象緊密相關(guān),互聯(lián)網(wǎng)和云計(jì)算可以被認(rèn)為是人工智能基石有兩個(gè)原因。

第一,它們可以讓所有聯(lián)網(wǎng)的計(jì)算機(jī)設(shè)備都能獲得海量數(shù)據(jù)。這些數(shù)據(jù)是人們推進(jìn)人工智能研發(fā)所需要的,因此它可以促進(jìn)人工智能的發(fā)展。

第二,它們?yōu)槿藗兲峁┝艘环N可行的合作方式——有時(shí)顯式有時(shí)隱式——來幫助人工智能系統(tǒng)進(jìn)行訓(xùn)練。

比如,有些研究人員使用類似Mechanical Turk這樣基于云計(jì)算的眾包服務(wù)來雇傭成千上萬的人來描繪數(shù)字圖像。這就使得圖像識(shí)別算法可以從這些描繪中進(jìn)行學(xué)習(xí)。谷歌翻譯通過分析用戶的反饋以及使用者的無償貢獻(xiàn)來提高它自動(dòng)翻譯的質(zhì)量。

4)新算法

算法是解決一個(gè)設(shè)計(jì)程序或完成任務(wù)的路徑方法。

最近幾年,新算法的發(fā)展極大提高了機(jī)器學(xué)習(xí)的能力,這些算法本身很重要,同時(shí)也是其他技術(shù)的推動(dòng)者,比如計(jì)算機(jī)視覺(這項(xiàng)科技將會(huì)在后文描述)。

機(jī)器學(xué)習(xí)算法目前被開源使用,這種情形將促成更大進(jìn)步,因?yàn)樵陂_源環(huán)境下開發(fā)人員可以補(bǔ)足和增強(qiáng)彼此的工作。

認(rèn)知技術(shù)

我們將區(qū)分人工智能領(lǐng)域和由此延伸的各項(xiàng)技術(shù)。

大眾媒體將人工智能刻畫為跟人一樣聰明的或比人更聰明的計(jì)算機(jī)的來臨。而各項(xiàng)技術(shù)則在以往只有人能做到的特定任務(wù)上面表現(xiàn)得越來越好。我們稱這些技術(shù)為認(rèn)知技術(shù),認(rèn)知技術(shù)是人工智能領(lǐng)域的產(chǎn)物,它們能完成以往只有人能夠完成的任務(wù)。

而它們正是商業(yè)和公共部門的領(lǐng)導(dǎo)者應(yīng)該關(guān)注的。

下面我們將介紹幾個(gè)最重要的認(rèn)知技術(shù),它們正被廣泛采納并進(jìn)展迅速,也獲得大量投資。

1)計(jì)算機(jī)視覺

是指計(jì)算機(jī)從圖像中識(shí)別出物體、場(chǎng)景和活動(dòng)的能力。

計(jì)算機(jī)視覺技術(shù)運(yùn)用由圖像處理操作及其他技術(shù)所組成的序列來將圖像分析任務(wù)分解為便于管理的小塊任務(wù)。

比如,一些技術(shù)能夠從圖像中檢測(cè)到物體的邊緣及紋理。分類技術(shù)可被用作確定識(shí)別到的特征是否能夠代表系統(tǒng)已知的一類物體。

計(jì)算機(jī)視覺有著廣泛應(yīng)用。

其中包括,醫(yī)療成像分析被用來提高疾病的預(yù)測(cè)、診斷和治療;人臉識(shí)別被Facebook用來自動(dòng)識(shí)別照片里的人物;在安防及監(jiān)控領(lǐng)域被用來指認(rèn)嫌疑人;在購(gòu)物方面,消費(fèi)者現(xiàn)在可以用智能手機(jī)拍攝下產(chǎn)品以獲得更多購(gòu)買選擇。

2)機(jī)器學(xué)習(xí)

指的是計(jì)算機(jī)系統(tǒng)無需遵照顯式的程序指令而只是依靠暴露在數(shù)據(jù)中來提升自身性能的能力。

其核心在于,機(jī)器學(xué)習(xí)是從數(shù)據(jù)中自動(dòng)發(fā)現(xiàn)模式,模式一旦被發(fā)現(xiàn)便可用于做預(yù)測(cè)。比如,給予機(jī)器學(xué)習(xí)系統(tǒng)一個(gè)關(guān)于交易時(shí)間、商家、地點(diǎn)、價(jià)格及交易是否正當(dāng)?shù)刃庞每ń灰仔畔⒌臄?shù)據(jù)庫(kù),系統(tǒng)就會(huì)學(xué)習(xí)到可用來預(yù)測(cè)信用卡欺詐的模式。處理的交易數(shù)據(jù)越多,預(yù)測(cè)就會(huì)越好。

機(jī)器學(xué)習(xí)的應(yīng)用范圍非常廣泛,針對(duì)那些產(chǎn)生龐大數(shù)據(jù)的活動(dòng),它幾乎擁有改進(jìn)一切性能的潛力。除了欺詐甄別之外,這些活動(dòng)還包括銷售預(yù)測(cè)、庫(kù)存管理、石油和天然氣勘探、以及公共衛(wèi)生。

機(jī)器學(xué)習(xí)技術(shù)在其他的認(rèn)知技術(shù)領(lǐng)域也扮演著重要角色,比如計(jì)算機(jī)視覺,它能在海量圖像中通過不斷訓(xùn)練和改進(jìn)視覺模型來提高其識(shí)別對(duì)象的能力。

3)自然語(yǔ)言處理

是指計(jì)算機(jī)擁有的人類般文本處理的能力。

比如,從文本中提取意義,甚至從那些可讀的、風(fēng)格自然、語(yǔ)法正確的文本中自主解讀出含義。

一個(gè)自然語(yǔ)言處理系統(tǒng)并不了解人類處理文本的方式,但是它卻可以用非常復(fù)雜與成熟的手段巧妙處理文本,例如自動(dòng)識(shí)別一份文檔中所有被提及的人與地點(diǎn);識(shí)別文檔的核心議題;或者在一堆僅人類可讀的合同中,將各種條款與條件提取出來并制作成表。

以上這些任務(wù)通過傳統(tǒng)的文本處理軟件根本不可能完成,后者僅能針對(duì)簡(jiǎn)單的文本匹配與模式進(jìn)行操作。

請(qǐng)思考一個(gè)老生常談的例子,它可以體現(xiàn)自然語(yǔ)言處理面臨的一個(gè)挑戰(zhàn)。

在句子“光陰似箭(Time flies like an arrow)”中每一個(gè)單詞的意義看起來都很清晰,直到系統(tǒng)遇到這樣的句子“果蠅喜歡香蕉(Fruit flies like a banana)”,用“水果(fruit)”替代了“時(shí)間(time)”,并用“香蕉(banana)”替代“箭(arrow)”,就改變了“飛逝/飛著的(like)”與“像/喜歡(like)”這兩個(gè)單詞的意思。

自然語(yǔ)言處理,像計(jì)算機(jī)視覺技術(shù)一樣,將各種有助于實(shí)現(xiàn)目標(biāo)的多種技術(shù)進(jìn)行了融合。

建立語(yǔ)言模型來預(yù)測(cè)語(yǔ)言表達(dá)的概率分布,舉例來說,就是某一串給定字符或單詞表達(dá)某一特定語(yǔ)義的最大可能性。選定的特征可以和文中的某些元素結(jié)合來識(shí)別一段文字,通過識(shí)別這些元素可以把某類文字同其他文字區(qū)別開來,比如垃圾郵件同正常郵件。

4)機(jī)器人技術(shù)

將機(jī)器視覺、自動(dòng)規(guī)劃等認(rèn)知技術(shù)整合至極小卻高性能的傳感器、致動(dòng)器、以及設(shè)計(jì)巧妙的硬件中,這就催生了新一代的機(jī)器人,它有能力與人類一起工作,能在各種未知環(huán)境中靈活處理不同的任務(wù)。

例如無人機(jī),還有可以在車間為人類分擔(dān)工作的“cobots”,還包括那些從玩具到家務(wù)助手的消費(fèi)類產(chǎn)品。

5)語(yǔ)音識(shí)別技術(shù)

主要是關(guān)注自動(dòng)且準(zhǔn)確的轉(zhuǎn)錄人類的語(yǔ)音。

該技術(shù)必須面對(duì)一些與自然語(yǔ)言處理類似的問題,在不同口音的處理、背景噪音、區(qū)分同音異形異義詞(“buy”和“by”聽起來是一樣的)方面存在一些困難,同時(shí)還需要具有跟上正常語(yǔ)速的工作速度。

語(yǔ)音識(shí)別系統(tǒng)使用一些與自然語(yǔ)言處理系統(tǒng)相同的技術(shù),再輔以其他技術(shù),比如描述聲音和其出現(xiàn)在特定序列和語(yǔ)言中概率的聲學(xué)模型等。

語(yǔ)音識(shí)別的主要應(yīng)用包括醫(yī)療聽寫、語(yǔ)音書寫、電腦系統(tǒng)聲控、電話客服等。比如Domino’s Pizza最近推出了一個(gè)允許用戶通過語(yǔ)音下單的移動(dòng)APP。

認(rèn)知技術(shù)的廣泛使用

各種經(jīng)濟(jì)部門已經(jīng)把認(rèn)知技術(shù)運(yùn)用到了多種商業(yè)職能中。

1)銀行業(yè)

自動(dòng)欺詐探測(cè)系統(tǒng)使用機(jī)器學(xué)習(xí)可以識(shí)別出預(yù)示著欺詐性付款行動(dòng)的行為模式;借助語(yǔ)音識(shí)別技術(shù)能夠自動(dòng)完成電話客服;聲音識(shí)別可以核實(shí)來電者的身份

2)醫(yī)療健康領(lǐng)域

美國(guó)有一半的醫(yī)院采用自動(dòng)語(yǔ)音識(shí)別來幫助醫(yī)生自動(dòng)完成醫(yī)囑抄錄,而且使用率還在迅速增長(zhǎng);機(jī)器視覺系統(tǒng)自動(dòng)完成乳房X光檢查和其他醫(yī)學(xué)影響的分析。

IM 的Watson借助自然語(yǔ)言處理技術(shù)來閱讀和理解大量醫(yī)學(xué)文獻(xiàn),通過假設(shè)自動(dòng)生成來完成自動(dòng)診斷,借助機(jī)器學(xué)習(xí)可以提高準(zhǔn)確率。

3)生命科學(xué)領(lǐng)域

機(jī)器學(xué)習(xí)系統(tǒng)被用來預(yù)測(cè)生物數(shù)據(jù)和化合物活動(dòng)的因果關(guān)系,從而幫助制藥公司識(shí)別出最有前景的藥物。

4)媒體與娛樂行業(yè)

許多公司正在使用數(shù)據(jù)分析和自然語(yǔ)言生成技術(shù),自動(dòng)起草基于數(shù)據(jù)的的公文材料,比如公司營(yíng)收狀況、體育賽事綜述等。

5)石油與天然氣

廠商將機(jī)器學(xué)習(xí)廣泛運(yùn)用在礦藏資源定位、鉆井設(shè)備故障診斷等眾多方面。

6)公共部門

出于監(jiān)控、合規(guī)和欺詐檢測(cè)等特定目的,公共部門也已經(jīng)開始使用認(rèn)知技術(shù)。

比如,喬治亞州正在通過眾包的形式來進(jìn)行財(cái)政披露和競(jìng)選捐助表格的數(shù)字化,在這個(gè)過程中他們就采用了一套自動(dòng)手寫識(shí)別系統(tǒng)。

7)零售商

零售商利用機(jī)器學(xué)習(xí)來自動(dòng)發(fā)現(xiàn)有吸引力的交叉銷售定價(jià)和有效的促銷活動(dòng)。

8)科技公司

它們正利用機(jī)器視覺、機(jī)器學(xué)習(xí)等認(rèn)知技術(shù)來改進(jìn)產(chǎn)品或者開發(fā)全新產(chǎn)品,比如 Roomba機(jī)器人吸塵器,Nest智能恒溫器。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容