AI+Music

什么是人工智能?

談及AI人工智能,很多人印象中就是機(jī)器人,像Siri、天貓精靈、小愛、小藝這種會(huì)和你對(duì)話的機(jī)器人會(huì)很容易讓人覺得這就是人工智能。但其實(shí)人工智能不止于此。

“ 好奇是人工智能嗎?”


“不,它只是一只沒有感情的吃飯機(jī)器”


其實(shí),人工智能的存在是為了幫助人類完成需要人類智能才能完成的復(fù)雜工作。機(jī)器人,圖像識(shí)別,自然語言處理,機(jī)器學(xué)習(xí),深度學(xué)習(xí),神經(jīng)網(wǎng)絡(luò),專家系統(tǒng)都是人工智能的另一種形式。為了讓機(jī)器變得智能,我們讓機(jī)器從視覺、聽覺、觸覺、甚至是思維模式上模仿人類,從而形成機(jī)器思維邏輯,即算法。

· 視覺-計(jì)算機(jī)視覺

為了讓機(jī)器像人類擁有眼睛一樣看到并且看懂,我們讓機(jī)器通過攝像頭捕捉到圖像信息,并且通過圖像識(shí)別技術(shù)讓機(jī)器“理解”圖像信息。機(jī)器擁有視覺后,可以幫助人類做很多事情,比如人臉識(shí)別,圖像分類,手勢(shì)識(shí)別等。

· 聽覺-自然語言處理

機(jī)器擁有視覺后,還需要擁有聽覺,能夠聽懂人類的語言,與人類溝通。所以在聽覺上,機(jī)器需要有自然語言處理能力,從獲取人類聲音到分析處理,到理解人類所表達(dá)得意思。

· 思維-機(jī)器學(xué)習(xí)

思維即大腦。大腦最重要的工作是理解然后做出決策。 理解的前提是學(xué)習(xí),所以有了機(jī)器學(xué)習(xí),機(jī)器學(xué)習(xí)的再進(jìn)一步是深度學(xué)習(xí)。而這些的背后都是一套套復(fù)雜的算法構(gòu)建而成的。既然機(jī)器的發(fā)明是為了幫助人類提升工作效率,那么基于理解后所做出的決策當(dāng)然是基于最優(yōu)解給出了,推薦算法、智能搜索的背后,都是機(jī)器幫助人類選擇出最優(yōu)解的實(shí)際應(yīng)用案例。

· 表達(dá)-人機(jī)交互

得出最優(yōu)決策后,機(jī)器如何將結(jié)果反饋給人類,形成溝通閉環(huán),就涉及到人機(jī)交互了。人機(jī)交互即人類與機(jī)器交流溝通的過程,其形式也有多種,可能是機(jī)器接收到指令后通過機(jī)械臂一系列的機(jī)械運(yùn)動(dòng),也可能是語音的表達(dá),可能是界面視覺的呈現(xiàn),也可能是人類不感知的自動(dòng)執(zhí)行操作。

目前,AI技術(shù)已經(jīng)深入各行各業(yè),不管是教育、醫(yī)療、交通、出行還是政府管理、制造、媒體等領(lǐng)域,AI技術(shù)在發(fā)揮著它的力量,讓生活更便捷,城市更美好。


AI加上Music ,又會(huì)碰撞出什么樣的火花呢?

音樂一詞對(duì)所有人都不陌生,美妙和諧的聲音,被認(rèn)為是音樂,所有聲音的產(chǎn)生背后都是一系列數(shù)學(xué)排列組合的結(jié)果,之所以聽起來和諧美妙,也蘊(yùn)含一定的數(shù)學(xué)規(guī)律在里面。同樣與數(shù)學(xué)強(qiáng)相關(guān)的音樂元素,與以數(shù)據(jù)為基礎(chǔ)的AI技術(shù),是否也存在某種聯(lián)系,能夠產(chǎn)生不同于以往認(rèn)知的創(chuàng)新變化呢。

我們可以將二者復(fù)盤拆解,再重新組合,探索新元素、新機(jī)會(huì)出現(xiàn)的可能。

音樂可分成旋律和歌詞,一般由專業(yè)人士制作生成,而其余人,主要通過聽欣賞音樂,稍微樂感好一些人,會(huì)最喜歡的作品進(jìn)行翻唱,再進(jìn)一步,也希望自己創(chuàng)作音樂的人則會(huì)憑感覺嘗試自作曲作詞。而旋律部分,也還能再拆解,有主旋律和伴奏,還有和聲部分。從音樂整體看也可以分為音樂創(chuàng)作、音樂表演、音樂欣賞、音樂評(píng)價(jià)。

結(jié)合AI,我們能做的事情有很多。早在1981年,David Cope 就用算法進(jìn)行音樂創(chuàng)作,除此之外,AI能幫我們的也還有很多。比如,根據(jù)主旋律自動(dòng)生成伴奏;根據(jù)音樂主題需要從以往歌詞中截取高頻詞匯,然后算法生成新的歌詞;幫助創(chuàng)作人在靈感枯竭的時(shí)候隨機(jī)創(chuàng)作;根據(jù)樂譜,機(jī)器能自動(dòng)演奏樂曲;機(jī)器還可以理解歌曲所包含的情感,有了此能力,可以將歌曲進(jìn)行情感歸類,然后推薦給需要的人,或者連接起相似的人,如網(wǎng)易云的“因樂交友”功能和各大音樂軟件的每日推薦功能;聽音識(shí)曲功能也是機(jī)器根據(jù)算法進(jìn)行曲庫快速匹配,幫助人類完成復(fù)雜的匹配工作;另外,除了對(duì)歌曲本身進(jìn)行修飾,還可以對(duì)聽歌體驗(yàn)進(jìn)行操作,如網(wǎng)易云的鯨云音效是音樂可視化商用的一個(gè)案例;計(jì)算機(jī)生成MV也給音樂包裝領(lǐng)域帶來不同的體驗(yàn)感受。

AI+音樂用在教育上的例子也有不少,結(jié)合AI的樂器或者旋律小節(jié)拆解,我們可以對(duì)歌曲的構(gòu)成有個(gè)更清晰的理解。一次音樂節(jié)目中,4536251的旋律套路被拿出來,被廣大網(wǎng)友驚嘆,原來音樂可以被這樣解讀,形式的轉(zhuǎn)變后,讓人感覺更容易理解了,也引發(fā)了音樂愛好者對(duì)更多音樂套路的探索。所以AI如果能夠發(fā)揮作用幫助人們探索更多音樂的奧秘,可以讓音樂更好地被理解和運(yùn)用。


為什么要聲音可視化?那是不是也可以圖像聲音化?

很多團(tuán)隊(duì)通過算法生成藝術(shù),在一些大型音樂現(xiàn)場(chǎng),將聲音可視化,通過電子熒屏讓計(jì)算機(jī)自動(dòng)生成優(yōu)美的圖像動(dòng)畫以配合音樂演出,起到氣氛渲染烘托得效果,讓觀眾在享受聽覺盛宴的同時(shí),視覺上也有個(gè)更沉浸的體驗(yàn)。在人類感知信息的途徑里,視覺和聽覺占主體,視覺占83%,聽覺占11%,如果說聲音可視化是為了更沉浸的視音體驗(yàn),那么是否有圖像聲音化的可能,其意義又在于什么?Qosmo的Imaginary Soundscape就是一個(gè)讓機(jī)器看懂圖像后,為其匹配最符合情境的旋律的圖像聲音化的案例。也許這只是實(shí)現(xiàn)了一個(gè)技術(shù)可能,其真正的目的和意義也許還未明晰,但是也讓人看到,聲音是有無限可能的。


我們常說玩音樂,玩音樂,那到底應(yīng)該怎么play with music呢?

各大音樂應(yīng)用中,青銅用戶參與音樂的方式大多停留在聽或者跟唱的程度,可是除了僅僅欣賞,在AI技術(shù)的幫助下我們與音樂之間是否有進(jìn)一步互動(dòng)的可能?實(shí)現(xiàn)真正的玩音樂呢?那么,我們與音樂應(yīng)該如何互動(dòng),互動(dòng)的目的是什么,AI的哪些相關(guān)技術(shù)能夠輔助人類?這些是尚待深入思考的問題。

另外,歌曲旋律中包含的情感信息量很大,這些信息被創(chuàng)作者表達(dá),被聽者接受,但是聽者二次表達(dá)的或者給予反饋的方式和途徑是很局限的,當(dāng)前主要是評(píng)論、分享和翻唱等。情緒是音樂的靈魂,音樂是人類溝通的另一種形式,為了實(shí)現(xiàn)信息閉環(huán),有沒有一種方式,能將聽者情緒很好地反饋表達(dá)。

生命不止,思考不斷,以上問題還在反思階段,如有建議提倡歡迎溝通探討~

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容