摘要:閔萬(wàn)里將在10月的云棲大會(huì)·阿里云生態(tài)峰會(huì)上分享阿里云ET大腦的項(xiàng)目實(shí)踐,并重點(diǎn)介紹ET大腦的應(yīng)用場(chǎng)景、技術(shù)挑戰(zhàn)和未來(lái)發(fā)展。
編者按:10月11-14日,為期四天的2017杭州云棲大會(huì)(門票火熱搶購(gòu)中?。⒃俣仍诤贾菰茥℃?zhèn)起航,作為全球最具影響力的科技展會(huì)之一,本屆大會(huì)將有不少阿里集團(tuán)專家以及各企業(yè)行業(yè)領(lǐng)袖的精彩演講。從今天開(kāi)始,云棲社區(qū)將會(huì)對(duì)大會(huì)嘉賓做一系列專訪(關(guān)注“云棲大會(huì)”社區(qū)公眾號(hào)了解更多大會(huì)信息)。本期我們采訪的是阿里云人工智能科學(xué)家閔萬(wàn)里,他將在10月的云棲大會(huì)·阿里云生態(tài)峰會(huì)上分享阿里云ET大腦的項(xiàng)目實(shí)踐,并重點(diǎn)介紹ET大腦的應(yīng)用場(chǎng)景、技術(shù)挑戰(zhàn)和未來(lái)發(fā)展。
2017杭州云棲大會(huì)詳情請(qǐng)戳這里!
閔萬(wàn)里,阿里云人工智能科學(xué)家,ET大腦負(fù)責(zé)人。2004年博士畢業(yè)以后加入IBM,參與IBM智慧城市研究,主攻大數(shù)據(jù)的研發(fā)和運(yùn)用,2010-2012年在IBM新加坡做智慧城市,推動(dòng)創(chuàng)新項(xiàng)目落地。2012年加入Google,擔(dān)任數(shù)據(jù)科學(xué)家,做廣告競(jìng)價(jià)的競(jìng)價(jià)模型。2013年9月加入阿里巴巴,組建了數(shù)據(jù)科學(xué)團(tuán)隊(duì),支持聚劃算和天貓做數(shù)據(jù)化運(yùn)營(yíng)。2015年加入阿里云,組建大數(shù)據(jù)孵化器團(tuán)隊(duì),探索DT技術(shù)在垂直行業(yè)的創(chuàng)新及落地。2017年開(kāi)始擔(dān)任阿里云大數(shù)據(jù)事業(yè)部的總經(jīng)理繼續(xù)推動(dòng)DT技術(shù)在各行各業(yè)的普及應(yīng)用。
數(shù)據(jù)智能在阿里云的應(yīng)用
閔萬(wàn)里加入阿里后,便迅速組建了一直能夠兼顧項(xiàng)目研究和商業(yè)化落地的人工智能團(tuán)隊(duì),這其中不得不提阿里云ET。
2016年4月,阿里云ET首次亮相,與此同時(shí)這也是首次以人工智能技術(shù)為背景,在歌唱比賽垂直業(yè)務(wù)場(chǎng)景中運(yùn)用ET。
“這是ET首次直面公眾,風(fēng)險(xiǎn)還是比較高的。”閔萬(wàn)里回憶道。
而最后的結(jié)果還是在這支團(tuán)隊(duì)的意料之中,最終ET以42%的勝率一舉命中總決賽歌王李玟,并且在三輪比賽中都預(yù)測(cè)準(zhǔn)確。“這個(gè)項(xiàng)目集合了阿里巴巴實(shí)時(shí)流計(jì)算的能力和多元數(shù)據(jù)實(shí)時(shí)分析的能力,還有實(shí)時(shí)預(yù)測(cè)的能力”,閔萬(wàn)里表示,這也阿里巴巴實(shí)時(shí)數(shù)據(jù)處理能力的一個(gè)集中展示。
和阿里巴巴其它人工智能應(yīng)用場(chǎng)景不同,ET的首次亮相綜合運(yùn)用了多數(shù)據(jù)來(lái)源,包括互聯(lián)網(wǎng)采集數(shù)據(jù)、湖南衛(wèi)視的收視率數(shù)據(jù)、還有ET對(duì)上百萬(wàn)首歌曲的學(xué)習(xí)和理解(包括每首歌好聽(tīng)的層度、演繹好壞的層度、現(xiàn)場(chǎng)歌手的聲調(diào))。閔萬(wàn)里告訴云棲社區(qū),ET能夠?qū)Χ喾N信號(hào)做實(shí)時(shí)解析,動(dòng)態(tài)更新,每五秒做一次預(yù)測(cè)更新,而要處理這樣的任務(wù)對(duì)技術(shù)的挑戰(zhàn)是巨大的。
“這里體現(xiàn)了很多能力,包括對(duì)歌曲的理解,以及對(duì)歌手每一句唱得好不好的分析。因?yàn)楦枨煤貌缓帽旧硎呛苤饔^的判斷,沒(méi)有明顯的客觀標(biāo)準(zhǔn)?!痹陂_(kāi)始比賽之前的一次性預(yù)測(cè)是很好實(shí)現(xiàn)的,但要收集這么大的數(shù)據(jù)量,五秒預(yù)測(cè)一次并更新,這就非常有挑戰(zhàn)性了。
閔萬(wàn)里提到,為此,前期項(xiàng)目團(tuán)隊(duì)花了很長(zhǎng)的時(shí)間來(lái)準(zhǔn)備數(shù)據(jù),以及讓ET學(xué)習(xí)歌曲并且做出預(yù)測(cè)。用機(jī)器學(xué)習(xí)歌曲的特征,需要結(jié)合網(wǎng)絡(luò)上歌曲的點(diǎn)播量、下載量、好評(píng)量等指標(biāo)來(lái)判斷這是不是一首好的歌,這個(gè)主要體現(xiàn)了項(xiàng)目的實(shí)時(shí)計(jì)算能力。
2016年,正值人工智能最火的那段時(shí)間,而ET憑借優(yōu)異的表現(xiàn)毫無(wú)懸念的成為了業(yè)界關(guān)注的焦點(diǎn)。
不過(guò)對(duì)于閔萬(wàn)里而言,如何把技術(shù)對(duì)外賦能,如何讓人工智能成為普惠技術(shù),才是最終的目的。
阿里云ET項(xiàng)目之后,閔萬(wàn)里便開(kāi)始推動(dòng)ET大腦項(xiàng)目。ET大腦起初是從幾個(gè)垂直行業(yè)中孵化出來(lái)的,如城市大腦、工業(yè)大腦、環(huán)境大腦、醫(yī)療大腦這些具有明顯行業(yè)背景的。可以說(shuō),ET可以歸屬于音樂(lè)大腦。
在閔萬(wàn)里看來(lái),ET用于音樂(lè),而城市大腦用于城市管理,工業(yè)大腦用于工業(yè)生產(chǎn)線,它們都是實(shí)時(shí)數(shù)據(jù)、活數(shù)據(jù)、在線更新的。云棲社區(qū)了解到,ET城市大腦項(xiàng)目在杭州、蕭山、蘇州等地與相關(guān)部門合作,用城市大腦協(xié)助城市管理,具體內(nèi)容包括實(shí)時(shí)信號(hào)燈控制——用互聯(lián)網(wǎng)、高德數(shù)據(jù)實(shí)時(shí)控制信號(hào)燈,這也意味著,大腦能消費(fèi)的數(shù)據(jù)變得更多。
除了信號(hào)燈的控制,利用iDST團(tuán)隊(duì)研發(fā)的專有算法, ET大腦還可以自動(dòng)巡檢幾千路的視頻信號(hào),自動(dòng)發(fā)現(xiàn)其中的異常點(diǎn),極大降低人工巡查的時(shí)間和精力;另外,城市大腦還能分析市民的出行意愿,調(diào)整公交班次,自動(dòng)調(diào)配;除此之外,閔萬(wàn)里還透露,他們正在做一些新的嘗試,比如在杭州某地最近進(jìn)行的城市綠波帶嘗試,把單個(gè)智能設(shè)備、單個(gè)智能系統(tǒng)串聯(lián)起來(lái),形成一個(gè)全局的智能系統(tǒng),形成智能設(shè)備之間的有效聯(lián)動(dòng),來(lái)最大限度的服務(wù)社會(huì),激發(fā)數(shù)據(jù)的價(jià)值。
在這樣的復(fù)雜場(chǎng)景下,ET大腦集成了多種人工智能技術(shù),而這樣的項(xiàng)目研發(fā)所遇到的挑戰(zhàn)包括技術(shù)上的挑戰(zhàn)和社會(huì)環(huán)境的挑戰(zhàn)。
閔萬(wàn)里談到,技術(shù)上的挑戰(zhàn)主要來(lái)自數(shù)據(jù)源和產(chǎn)品化兩方面:數(shù)據(jù)源的挑戰(zhàn)是指在很多垂直場(chǎng)景下,很多數(shù)據(jù)拿不出來(lái),或者沒(méi)辦法實(shí)時(shí)拿出來(lái)。一是因?yàn)閿?shù)據(jù)獲取比較復(fù)雜,或者數(shù)據(jù)擁有者有很多顧慮;二是因?yàn)橛械臄?shù)據(jù)擁有者雖然積極配合,但是數(shù)據(jù)殘次不齊,例如說(shuō)有的城市的交警數(shù)據(jù),地面上很多線圈已經(jīng)壞了,有的工業(yè)上的數(shù)據(jù)讀取中有很多工業(yè)協(xié)議讀取不了。
而產(chǎn)品化的挑戰(zhàn)則是大多人工智能應(yīng)用場(chǎng)景的通病:很多先進(jìn)的人工智能技術(shù)和算法在實(shí)驗(yàn)室里效果很好,但是移植到實(shí)戰(zhàn)當(dāng)中部署的時(shí)候,需要面臨實(shí)驗(yàn)室產(chǎn)品運(yùn)用到行業(yè)的挑戰(zhàn),包括運(yùn)行效率、穩(wěn)健性等,比如出現(xiàn)數(shù)據(jù)斷傳的情況怎么辦,出現(xiàn)數(shù)據(jù)被污染的情況怎么辦,這些都是項(xiàng)目需要解決的問(wèn)題。除了技術(shù)上的挑戰(zhàn),團(tuán)隊(duì)也面臨環(huán)境的挑戰(zhàn)。很多人對(duì)這種出現(xiàn)的新技術(shù)是質(zhì)疑的,當(dāng)大家看不到價(jià)值的時(shí)候都喜歡問(wèn)做這些有什么價(jià)值。對(duì)于一個(gè)創(chuàng)新者來(lái)說(shuō),沒(méi)有機(jī)會(huì)去證明他自己是很難回答這個(gè)問(wèn)題的。
堅(jiān)持普惠的ET大腦項(xiàng)目應(yīng)用
目前,ET大腦涵蓋了城市大腦、工業(yè)大腦、醫(yī)療大腦以及環(huán)境大腦。對(duì)于這些領(lǐng)域的選擇,閔萬(wàn)里給出了他的解答:第一,項(xiàng)目始終堅(jiān)持普惠的理念,這些行業(yè)服務(wù)的是全人類,工業(yè)制造的效率提升可以讓老百姓從中受益;第二,技術(shù)上說(shuō)這幾個(gè)行業(yè)都是數(shù)據(jù)密集型行業(yè),數(shù)據(jù)密度夠高,價(jià)值密度也很大;第三,這些行業(yè)痛點(diǎn)尤其突出,因?yàn)榇罅康臄?shù)據(jù)沒(méi)有被利用起來(lái),數(shù)據(jù)不流動(dòng)就成為了“庫(kù)存”,就會(huì)導(dǎo)致資產(chǎn)負(fù)擔(dān),所以要把負(fù)債變成價(jià)值。
迄今各個(gè)大腦的進(jìn)展都很順利,并且表現(xiàn)出了驚人的成績(jī)。城市大腦方面,項(xiàng)目在杭州和蘇州與相關(guān)單位已經(jīng)開(kāi)始合作,逐步推廣落地。目前在部分區(qū)域的視頻自動(dòng)巡檢和交通狀態(tài)報(bào)警已經(jīng)初見(jiàn)成效。工業(yè)大腦方面已經(jīng)有不少成功的案例,比如流程制造的中策橡膠、協(xié)鑫、天合光能。除此之外,在裝備制造、離散制造中也開(kāi)始了初步嘗試。醫(yī)療大腦方面,項(xiàng)目通過(guò)生態(tài)的力量推進(jìn)醫(yī)療大腦在各個(gè)細(xì)分領(lǐng)域的研發(fā),提供計(jì)算能力與算法服務(wù)。項(xiàng)目舉辦的醫(yī)療肺結(jié)節(jié)診斷大賽,在本次云棲大會(huì)中即將完美收官,并且在肺結(jié)節(jié)的診斷上已經(jīng)取得了階段性成果。環(huán)境大腦方面正在推進(jìn)內(nèi)蒙古自治區(qū)和阿里云ET環(huán)境大腦的合作,通過(guò)人工智能技術(shù)尋找保護(hù)環(huán)境的新方式,還利用環(huán)境大腦在江蘇對(duì)固廢污染源實(shí)現(xiàn)了智能感知。
事實(shí)上,現(xiàn)在的ET大腦已然成為了阿里云人工智能的代名詞,它很好地解決了兩方面的問(wèn)題。第一,ET大腦能夠解決更多行業(yè)的問(wèn)題,創(chuàng)新性的問(wèn)題;第二,ET大腦能夠承載一個(gè)平臺(tái)的使命,讓更多有想法的人利用ET大腦的開(kāi)放架構(gòu)來(lái)探索更多創(chuàng)新應(yīng)用。ET大腦的身先士卒,在一些垂直行業(yè)做出了創(chuàng)新的示范,極大證明了阿里云計(jì)算及大數(shù)據(jù)產(chǎn)品的潛力。此外,城市大腦、工業(yè)大腦、交通大腦、醫(yī)療大腦則會(huì)在接下來(lái)的航空、能源、新零售甚至安全領(lǐng)域做一些創(chuàng)新性的示范。閔萬(wàn)里表示,“我們希望通過(guò)這些示范能夠激活更多的外腦,讓社會(huì)上一些有創(chuàng)造性想法、有技術(shù)的公司能在ET大腦的架構(gòu)上做自主創(chuàng)新,讓ET大腦不僅僅成為阿里云自主創(chuàng)新的大腦,更是成為一個(gè)平臺(tái)支持全民創(chuàng)新。”所以可以說(shuō),ET大腦希望的是把公共數(shù)據(jù)資源的價(jià)值與業(yè)務(wù)的場(chǎng)景快速結(jié)合,產(chǎn)生實(shí)戰(zhàn)效果。
撥云見(jiàn)“智”,人工智能協(xié)同共生的未來(lái)
談到阿里云ET大腦時(shí),閔萬(wàn)里表示,這實(shí)質(zhì)上都屬于數(shù)據(jù)智能范疇——用新技術(shù)(云計(jì)算和數(shù)智技術(shù))加上新能源(數(shù)據(jù)),來(lái)打造新物種(新零售、新制造等等)。他認(rèn)為,在數(shù)據(jù)智能的實(shí)踐上,要找準(zhǔn)業(yè)務(wù)場(chǎng)景、痛點(diǎn)以及最佳應(yīng)用場(chǎng)景,要場(chǎng)景化和垂直化,因?yàn)閿?shù)據(jù)智能不止是一門技術(shù),它還是技術(shù)與業(yè)務(wù)的結(jié)合,更是一種理念。
除了阿里集團(tuán)本身?yè)碛懈嗟乃惴ê秃陀?jì)算能力之外,閔萬(wàn)里的成功秘訣就是敢于想別人不敢想的事兒,挑戰(zhàn)不可能?!爱?dāng)所有人都說(shuō)不可能的時(shí)候,有可能你就要成功了?!?/p>
當(dāng)然,現(xiàn)在的人工智能遠(yuǎn)遠(yuǎn)沒(méi)有達(dá)到大眾的預(yù)期。而對(duì)于未來(lái)的趨勢(shì),閔萬(wàn)里也給出了他的答案——語(yǔ)言視頻圖像等單維度功能的綜合協(xié)調(diào)是人工智能的下一步。
“未來(lái)的人工智能不止是視頻或者語(yǔ)音,一定是多種功能的協(xié)同,其核心就是協(xié)同。另外,人工智能要回歸到認(rèn)知的本質(zhì),要在類腦的研究上下功夫。”他所帶領(lǐng)的團(tuán)隊(duì)已經(jīng)做出了下一步規(guī)劃:一是ET大腦要產(chǎn)品化,要開(kāi)放,ET大腦產(chǎn)品化正在推進(jìn)中,同時(shí)項(xiàng)目會(huì)開(kāi)放平臺(tái),邀請(qǐng)和鼓勵(lì)生態(tài)伙伴一起在ET大腦的架構(gòu)上做行業(yè)化、垂直化的創(chuàng)新運(yùn)用;二是在一些從沒(méi)有涉及的垂直領(lǐng)域,預(yù)計(jì)會(huì)去率先打造一些垂直示范的項(xiàng)目,再激活對(duì)應(yīng)行業(yè)中的ISV(獨(dú)立軟件開(kāi)發(fā)商)。
而項(xiàng)目的具體情況他將在杭州云棲大會(huì)上逐一公布,屆時(shí)閔萬(wàn)里將分享?yè)茉埔?jiàn)“智”的話題,聚焦數(shù)據(jù)智能的生態(tài)和復(fù)合多體智能。
PS:ET大腦是一個(gè)普惠科技,致力于讓更多的人在這個(gè)平臺(tái)上成功,包括有想法的數(shù)據(jù)科學(xué)家、數(shù)據(jù)愛(ài)好者和合作伙伴。此外,項(xiàng)目天池能夠提供平臺(tái)、課程、數(shù)據(jù)并且定期發(fā)布任務(wù),已經(jīng)吸引了全球73個(gè)國(guó)家和地區(qū)的十萬(wàn)多名開(kāi)發(fā)者,借助人工智能和大數(shù)據(jù)解決生產(chǎn)生活中的實(shí)際問(wèn)題。另一方面,復(fù)合多體智能是團(tuán)隊(duì)對(duì)人工智能在具體場(chǎng)景中落地的終極判斷,最近也有了一些新的嘗試和實(shí)地試運(yùn)行:通過(guò)對(duì)單個(gè)智能設(shè)備的串聯(lián)形成了一個(gè)全局的智能系統(tǒng),讓系統(tǒng)內(nèi)的各個(gè)智能設(shè)備可以群策群力,形成從感知、指揮、全局協(xié)調(diào)的智慧城市。