互聯(lián)網(wǎng)技術(shù)的發(fā)展,人們生活日趨便利,即使是在聊天、記錄上也出現(xiàn)了許多工具供人們“偷懶”。聊天指的是人們通過網(wǎng)絡(luò)的交流,最普通的方式為打字交流,漸漸的出現(xiàn)了語音輸入。對比打字,語音輸入的方式能更快捷準確的表達出意思,不用大篇幅的文字描述,像在走路的情況下,語音輸入的方式讓人們不用做“低頭族”而忽略了身旁的危險。
但美中不足的是,語音的方式會受嘈雜環(huán)境的影響,并且在一些辦公場景中,語音交流的方式顯然不合適。總體來見語音輸入利大于弊,便捷、實用大家都是有目共睹。
在這些因素影響下,一些輸入法開始出現(xiàn)了語音轉(zhuǎn)文字的功能,這個功能讓使用者在得知對方不便于聆聽語音消息的情況下,也能便捷的使用語音功能,讓其轉(zhuǎn)化為文字表述。到現(xiàn)在,聊天軟件如QQ已經(jīng)推出了直接的語音消息轉(zhuǎn)文字功能,即使用者不需要借助輸入法完成文字轉(zhuǎn)化,而是直接發(fā)送語音消息,對方能夠?qū)⑵滢D(zhuǎn)化為文字查看。
這些都是語音轉(zhuǎn)文字在生活中的實際應用,那么語音轉(zhuǎn)文字除了交流,還可以做什么?分析語音表達信息的優(yōu)勢,我們可將它運用到記錄上來。實現(xiàn)快捷、準確的記錄,實際可用在會議采訪、辦公寫作、筆記記錄等,這方面的需求造就了錄音筆等工具的出現(xiàn),整理成文字信息的枯燥工作則促使人們渴望語音轉(zhuǎn)文字工具的到來,語記應用為響應大眾的需求而到來。
了解了語記應用的背景以及它的作用,在實際的工作中它需要哪些技術(shù)支持或者功能需要?
1.語音的識別
包括基本的語音信息識別,準確的翻譯是使用者選擇的關(guān)鍵,也是提升用戶體驗的關(guān)鍵所在。可以優(yōu)化的地方是不同口音、不同語言的識別,比如考慮各地方言語料的訓練、英語識別的導入。
2.遠近聲音的采集
將語記應用分為常規(guī)模式和會議模式,實現(xiàn)較長距離的語音采錄。但在嘈雜的環(huán)境下,文字的轉(zhuǎn)換會受到很大的影響,借助其他錄制工具再導入到應用在進行轉(zhuǎn)換是最好的處理方法。這就代表了語記應用需要具備音頻文件上傳的功能,當前了解到的有訊飛聽見、息息語記支持該功能。

3.文字的編輯和輸出
語音轉(zhuǎn)換難免會出現(xiàn)與實際意思存在誤差的地方,這就需要對文字內(nèi)容進行修改,一邊播放錄音一邊進行修改,不可缺失。使用了多款語記應用,筆者發(fā)現(xiàn)雖然大部分都能滑動錄音條,但都不能完成在文字上的標注或者是選到需要修改文字的地方,而錄音卻不可準確的定位,加大了工作難度,需要一定的優(yōu)化和改進。
文字轉(zhuǎn)換出來,不僅是為了在手機上記錄,更多人需要的是整理成文件用于分享,那么文件的分享上傳可以肯定是非常重要的存在。
語記應用對生活、學習都是便利的存在,能使人們工作效率得到一定的提升。在物聯(lián)網(wǎng)時代,越來越多智能產(chǎn)品豐富我們的生活,相比新鮮感,實用性更受人們的喜愛,對于語音轉(zhuǎn)文字你還有什么看法或建議?