從Prisma說開去(下)

剛剛看了Prisma的原理之后,老土突然覺得這種將圖片的內(nèi)容和圖片的樣式分離并再次組合的思路好像在什么地方見過!在“以需要開心的思考”這個(gè)非常“成熟”的理由下,老土默默的喝了一杯c記甜水。之后老土竟然真的想起來了,好像在很久之前的一種被稱為MIDI的音樂格式就是利用這個(gè)思路,即將音樂的內(nèi)容和音樂的樣式分離開...MIDI的技術(shù)原理可以在百度上搜到,這里簡單轉(zhuǎn)述如下。

MIDI文件是一種描述性的“音樂語言”,它將所要演奏的樂曲信息用字節(jié)進(jìn)行描述。譬如在某一時(shí)刻,使用什么樂器,以什么音符開始,以什么音調(diào)結(jié)束,加以什么伴奏等等,MIDI文件本身并不包含波形數(shù)據(jù),所以MIDI文件非常小巧。在播放時(shí),根據(jù)MIDI文件記錄的樂曲信息向波表發(fā)出指令,從“表格”中逐一找出對應(yīng)的聲音信息,經(jīng)過合成、加工后回放出來。而“波表”指的是將各種真實(shí)樂器所能發(fā)出的所有聲音(包括各個(gè)音域、聲調(diào))進(jìn)行取樣,存儲為一個(gè)波表文件。

通過上面原理可以看出,MIDI文件中保存的內(nèi)容相當(dāng)于“音樂的內(nèi)容”,而波表文件中保存的內(nèi)容相當(dāng)于“音樂的樣式”,而MIDI音樂的播放過程實(shí)際上就是再次將“音樂的內(nèi)容”與“音樂的樣式”組合在一起的過程。MIDI的這種思路在今天的音頻處理領(lǐng)域已經(jīng)獲得了非常廣泛的應(yīng)用,比如:科大訊飛有一款應(yīng)用叫“訊飛語記”。這款應(yīng)用不但支持識別用戶的語音并以文本的形式加以保存,而且支持將文本再次轉(zhuǎn)換為語音。更為重要的是,這款應(yīng)用可以實(shí)現(xiàn)文本轉(zhuǎn)換為語音的時(shí)候使用不同的聲音效果(如:王老師,小蘿莉,男主播等)。在這款應(yīng)用中,用于轉(zhuǎn)換為語音的文本就是“語音的內(nèi)容”,而“王老師,小蘿莉,男主播”等不同的音效就是“語音的樣式”。因此可以說,“訊飛語記”的語音生成也是基于“語音的內(nèi)容”與“語音的樣式”的分離和融合。

訊飛語記

今天從Prisma說到了語音合成,內(nèi)容的跨度算是很大了。不過今天既然開了頭就不怕腦洞更大一些。Prisma是圖片的內(nèi)容與樣式的分離,訊飛語記是語音的內(nèi)容與樣式的分離,還有其他的“內(nèi)容”與“樣式”分離的案例嗎?

有!比如《攻殼機(jī)動隊(duì)》!這個(gè)片子的核心內(nèi)容就是,人的”靈魂“與軀殼的分離。這里不妨復(fù)習(xí)一下《攻殼機(jī)動隊(duì)》中最最著名的一段臺詞。

生死來去,棚頭傀儡。一線斷時(shí),落落磊磊

什么是人的靈魂?老土覺得可以將“靈魂”對應(yīng)為“人的內(nèi)容”,而人的軀殼則是“人的樣式”。因此《攻殼機(jī)動隊(duì)》是人的內(nèi)容與樣式的分離!

人的內(nèi)容與樣式的分離

關(guān)于《攻殼機(jī)動隊(duì)》的內(nèi)容,各位看官也可以看看老土之前的一個(gè)帖子。

[老土來推薦閱讀]關(guān)于《攻殼機(jī)動隊(duì)》的一些內(nèi)容(http://www.itdecent.cn/p/45c270fbead4

[全文完]


這樣一路分析下來,老土仿佛get到了什么,“內(nèi)容與樣式的分離將成為某種模式?”。如果其可以成為一種模式,是否可以基于此模式演繹出更多的應(yīng)用場景?...

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容