視頻通信系統(tǒng)的關(guān)鍵技術(shù)與挑戰(zhàn)

當我們觀看各類直播時,當我們與家人朋友進行視頻通話時,當我們利用遠程監(jiān)控查看孩子在幼兒園的狀況時,這其中涉及的技術(shù)就是視頻通信技術(shù)。

隨著現(xiàn)代通信技術(shù)和業(yè)務的發(fā)展,以傳送語言視頻為一體的視頻通信業(yè)務已經(jīng)成為通信領(lǐng)域發(fā)展的熱點,其在視頻會議、遠程視頻醫(yī)療、遠程視頻教育等方面得到越來越廣泛的應用。而高效穩(wěn)定的視頻通信系統(tǒng)是開展各類視頻通信業(yè)務的基礎。

一、如何構(gòu)建視頻通信系統(tǒng)

構(gòu)建視頻通信系統(tǒng)是一項綜合了數(shù)據(jù)采集、處理和顯示技術(shù),數(shù)據(jù)壓縮編解碼技術(shù)和網(wǎng)絡傳輸技術(shù)的系統(tǒng)性工程。而一個基礎的視頻通信系統(tǒng)過程主要包含以下三個步驟:

1)數(shù)據(jù)發(fā)送方采集數(shù)據(jù):包括音頻、視頻以及文本等多媒體數(shù)據(jù);

2)通過網(wǎng)絡將壓縮的數(shù)據(jù)傳送到接收方;

3)數(shù)據(jù)接收方接收到數(shù)據(jù)后,解碼得到多媒體數(shù)據(jù),進行顯示和播放。

但是在日常的業(yè)務中,不同的業(yè)務對視頻通信系統(tǒng)的技術(shù)要求的側(cè)重點是不一樣的,例如:對于視頻會議,要求雙方或多方的視頻通信過程能實時進行,延時盡可能低,同時要保持通信過程流暢不卡頓;而對于視頻監(jiān)控系統(tǒng),則對視頻清晰度要求較高,能保留畫面中的重要細節(jié)內(nèi)容,而對延時比較寬容。

盡管不同的業(yè)務有不同的側(cè)重點,如何構(gòu)建一個高效穩(wěn)定的視頻通信系統(tǒng),卻一直是視頻通信運營商的追求。

構(gòu)建一套視頻通信系統(tǒng),是一項綜合了音視頻處理、編解碼以及網(wǎng)絡傳輸?shù)燃夹g(shù)的綜合性工程

二、如何構(gòu)建高效穩(wěn)定的視頻通信系統(tǒng)

1. 數(shù)據(jù)采集技術(shù):需要能高效及時地獲取到高質(zhì)量的原始數(shù)據(jù)。

例如:在實時視頻通話應用中,通常需要對采集到的音頻預處理,主要有濾除背景雜音,檢測并消除回音等;在監(jiān)控視頻中,則會對采集到的視頻進行去霧、改善強光干擾、夜間圖像增強等處理。

2.?數(shù)據(jù)壓縮技術(shù):數(shù)據(jù)壓縮中的視頻壓縮技術(shù),是整個視頻通信系統(tǒng)中的核心技術(shù)。

由于原始視頻的數(shù)據(jù)量非常大,如果不經(jīng)過壓縮,將會給傳輸和存儲帶來極大的壓力。而高效的視頻編碼技術(shù)能在滿足傳輸帶寬的限制下保持盡可能高的質(zhì)量,或者在保證一定質(zhì)量的條件下,獲得盡可能高的壓縮率。

在低延時的業(yè)務中,對壓縮速度的要求也非常高。比如要達到每秒20幀的幀率,就要求壓縮每一幀的時間低于50毫秒,同時還要兼顧到壓縮的性能。目前主流的視頻編碼標準H.264/AVC,可以獲得不錯的性能和速度的折中。下一代的視頻編碼標準是H.265/HEVC,雖然其碼率相比H.264在同等編碼質(zhì)量的情況下能節(jié)省45%,但是由于其專利問題和巨大的計算量,目前還沒有得到廣泛應用。

在屏幕分享和視頻通話業(yè)務中,要根據(jù)不同的場景設置分辨率。前者需要看清屏幕文字等細節(jié),對分辨率要求很高;后者,由于人臉總體是平坦的,分辨率則可以設置得低一些。如果是閉環(huán)的通信系統(tǒng),甚至可以根據(jù)具體應用開發(fā)非標準編解碼技術(shù)或改進現(xiàn)有的標準編解碼技術(shù)。

3.?網(wǎng)絡傳輸技術(shù)視頻通信系統(tǒng)的關(guān)鍵技術(shù)。

壓縮后的數(shù)據(jù)需要根據(jù)合適的網(wǎng)絡傳輸協(xié)議打包,打包后的數(shù)據(jù)經(jīng)過網(wǎng)絡傳輸?shù)浇邮斩?,接收端再根?jù)網(wǎng)絡協(xié)議解析出壓縮數(shù)據(jù)。根據(jù)業(yè)務類型以及傳輸數(shù)據(jù)的類型,需要選取不同的傳輸協(xié)議。最常用的兩種傳輸協(xié)議是傳輸控制協(xié)議TCP和用戶數(shù)據(jù)包協(xié)議UDP:TCP是面向連接的可靠傳輸協(xié)議,但是延時相對較大;UDP是無連接、不可靠的傳輸協(xié)議,但是延時相對較小。

在視頻通信系統(tǒng)中,主要包括多媒體數(shù)據(jù)(音頻、視頻、文本等數(shù)據(jù))和控制信令數(shù)據(jù)(登入服務器,用戶連接變動等消息)。其中控制信令數(shù)據(jù),起到了調(diào)度通信各方的作用,對整個系統(tǒng)的正常運行非常重要,需要穩(wěn)定的傳輸,所以一般采用TCP協(xié)議,以達到穩(wěn)定傳輸?shù)哪康?。而對于多媒體數(shù)據(jù),由于對延時要求高,而且丟包對整個系統(tǒng)的運行影響不大,往往采用UDP協(xié)議,以達到及時傳輸?shù)哪康摹?/p>

但是這樣的選擇也不是絕對的,比如在對多媒體數(shù)據(jù)延時要求不高的業(yè)務中,也可以采用TCP?;蛘吒鶕?jù)特定場景開發(fā)某種協(xié)議,比如基于UDP協(xié)議開發(fā)一種重傳機制的協(xié)議,在滿足低延時的前提下,同時避免數(shù)據(jù)傳輸?shù)膩G失導致通信中斷??傊?b>網(wǎng)絡傳輸技術(shù)對于通信穩(wěn)定流暢的進行至關(guān)重要,需要結(jié)合業(yè)務本身進行合理設計。

4.?多媒體數(shù)據(jù)的解碼播放視頻通信系統(tǒng)的最后一步。

要達到音畫同步,同時避免出現(xiàn)花屏的效果。解碼時,需要根據(jù)解碼標準檢測是否丟失了數(shù)據(jù),對解碼失敗的視頻幀采取不予顯示或請求重發(fā)等措施,避免出現(xiàn)不完整解碼幀,也就是花屏的現(xiàn)象。同時對音視頻的播放,要根據(jù)時間戳進行同步播放,否則會極大地影響用戶體驗。對于解碼得到的音頻,由于采樣率變化、壓縮失真等影響,往往要經(jīng)過濾波、自動增益等處理,從而得到圓潤而不刺耳的聲音效果。當然,在多人通信中,首先還要對多路音頻進行混音。

三、構(gòu)建高效穩(wěn)定的視頻通信系統(tǒng)的影響因素

傳輸帶寬的不穩(wěn)定。網(wǎng)絡環(huán)境復雜多變,尤其是移動網(wǎng)絡環(huán)境,傳輸帶寬可能是實時變化的。在這樣的網(wǎng)絡環(huán)境下要實現(xiàn)視頻通信的流暢進行,需要編碼的輸出碼率能自適應變化。如果一段時間內(nèi)網(wǎng)絡帶寬變得緊張,而編碼輸出碼率仍然較高,則無法及時傳輸數(shù)據(jù),接收方就會出現(xiàn)卡頓的現(xiàn)象,對用戶體驗影響很大;而當網(wǎng)絡帶寬有很大富余的時候,如果還是采用低碼率進行編碼,則是對帶寬的浪費,同時接收方的視頻質(zhì)量也較差。


四、解決辦法

要實現(xiàn)流暢高質(zhì)量的視頻通信,編碼端需要根據(jù)實時的網(wǎng)絡狀態(tài)進行壓縮率的調(diào)整,這可以通過改變量化參數(shù)、改變分辨率或改變幀率等方法實現(xiàn)。而對網(wǎng)絡狀態(tài)的實時感知,就需要網(wǎng)絡傳輸模塊對網(wǎng)絡狀態(tài)進行統(tǒng)計監(jiān)測,并將網(wǎng)絡的實時狀態(tài)信息提供給編碼端。

網(wǎng)絡傳輸模塊根據(jù)丟包率等統(tǒng)計信息,向編碼器反饋網(wǎng)絡狀態(tài),編碼器根據(jù)網(wǎng)絡狀態(tài)對編碼參數(shù)進行調(diào)整,改變輸出碼率

當然也可以設計一種編碼端和解碼端的正、反饋機制來實現(xiàn)碼率控制。具體來說,可以在編碼端設計某種檢驗碼,使得解碼端收到消息后能夠知道是否丟包,從而進行丟包統(tǒng)計。根據(jù)統(tǒng)計結(jié)果估計出網(wǎng)絡狀態(tài),然后給編碼端發(fā)送反饋信息。根據(jù)反饋的信息,編碼器一方面可以向解碼器重新發(fā)送丟失的重要數(shù)據(jù);另一方面也可以得知網(wǎng)絡狀態(tài),及時實施合適的碼率控制措施,使得通信流暢地進行。采用這種設計模式時,編解碼系統(tǒng)就構(gòu)成了一個完整的閉環(huán)系統(tǒng)。此時媒體數(shù)據(jù)對于網(wǎng)絡傳輸是透明的,因而網(wǎng)絡傳輸模塊只需要提供傳輸通路。

解碼端根據(jù)解碼失敗率估計網(wǎng)絡狀態(tài),將信息反饋給編碼器,同樣能起到碼率實時控制的功能。此時網(wǎng)絡傳輸模塊不需要關(guān)心所傳輸?shù)膬?nèi)容,只是提供了傳輸通路

五、總結(jié):

要保證視頻通信系統(tǒng)的穩(wěn)定流暢運行,除各個技術(shù)模塊的性能都足夠好之外,還需要各個模塊之間合理高效的配合。這其中最主要的是編碼模塊和網(wǎng)絡傳輸模塊的配合,以及編碼和解碼端的正、反饋機制

總的來說,構(gòu)建一個完善高效的視頻通信系統(tǒng)是一項極其復雜的、需要多項關(guān)鍵技術(shù)密切配合的系統(tǒng)性工程;同時也是需要根據(jù)業(yè)務的具體要求合理地開發(fā)和優(yōu)化的工程。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

友情鏈接更多精彩內(nèi)容