音視頻學(xué)習(xí)-MediaCodec API 詳解

原文: http://www.cnblogs.com/renhui/p/7478527.html

在學(xué)習(xí)了Android 音視頻的基本的相關(guān)知識,并整理了相關(guān)的API之后,我們應(yīng)該對基本的音視頻有一定的輪廓了。

下面開始接觸一個Android音視頻中相當(dāng)重要的一個API: MediaCodec。通過這個API,我們能夠做很多Android音視頻方面的工作,下面是我們學(xué)習(xí)這個API的時候,主要的方向:

學(xué)習(xí) MediaCodec API,完成音頻 AAC 硬編、硬解
學(xué)習(xí) MediaCodec API,完成視頻 H.264 的硬編、硬解

一、MediaCodec 介紹

MediaCodec類可以用于使用一些基本的多媒體編解碼器(音視頻編解碼組件),它是Android基本的多媒體支持基礎(chǔ)架構(gòu)的一部分通常和 MediaExtractor, MediaSync, MediaMuxer, MediaCrypto, MediaDrm, Image, Surface, and AudioTrack 一起使用。

一個編解碼器可以處理輸入的數(shù)據(jù)來產(chǎn)生輸出的數(shù)據(jù),編解碼器使用一組輸入和輸出緩沖器來異步處理數(shù)據(jù)。你可以創(chuàng)建一個空的輸入緩沖區(qū),填充數(shù)據(jù)后發(fā)送到編解碼器進(jìn)行處理。編解碼器使用輸入的數(shù)據(jù)進(jìn)行轉(zhuǎn)換,然后輸出到一個空的輸出緩沖區(qū)。最后你獲取到輸出緩沖區(qū)的數(shù)據(jù),消耗掉里面的數(shù)據(jù),釋放回編解碼器。如果后續(xù)還有數(shù)據(jù)需要繼續(xù)處理,編解碼器就會重復(fù)這些操作。輸出流程如下:


image.png
編解碼器支持的數(shù)據(jù)類型:

編解碼器能處理的數(shù)據(jù)類型為:壓縮數(shù)據(jù)、原始音頻數(shù)據(jù)原始視頻數(shù)據(jù)。你可以通過ByteBuffers能夠處理這三種數(shù)據(jù),但是需要你提供一個Surface,用于對原始的視頻數(shù)據(jù)進(jìn)行展示,這樣也能提高編解碼的性能。Surface使用的是本地的視頻緩沖區(qū),這個緩沖區(qū)不映射或拷貝到ByteBuffers。這樣的機(jī)制讓編解碼器的效率更高。通常在使用Surface的時候,無法訪問原始的視頻數(shù)據(jù),但是你可以使用ImageReader訪問解碼后的原始視頻幀。在使用ByteBuffer的模式下,您可以使用Image類和getInput/OutputImage(int)訪問原始視頻幀。

編解碼器的生命周期:

主要的生命周期為:StoppedExecuting、Released。

Stopped的狀態(tài)下也分為三種子狀態(tài):Uninitialized、Configured、Error。
Executing的狀態(tài)下也分為三種子狀態(tài):Flushed, Running、End-of-Stream。

下圖是生命周期的說明圖:


image.png

如圖可以看到:

  1. 當(dāng)創(chuàng)建編解碼器的時候處于未初始化狀態(tài)。首先你需要調(diào)用configure(…)方法讓它處于Configured狀態(tài),然后調(diào)用start()方法讓其處于Executing狀態(tài)。在Executing狀態(tài)下,你就可以使用上面提到的緩沖區(qū)來處理數(shù)據(jù)。

  2. Executing的狀態(tài)下也分為三種子狀態(tài):Flushed, Running、End-of-Stream。在start() 調(diào)用后,編解碼器處于Flushed狀態(tài),這個狀態(tài)下它保存著所有的緩沖區(qū)。一旦第一個輸入buffer出現(xiàn)了,編解碼器就會自動運(yùn)行到Running的狀態(tài)。當(dāng)帶有end-of-stream標(biāo)志的buffer進(jìn)去后,編解碼器會進(jìn)入End-of-Stream狀態(tài),這種狀態(tài)下編解碼器不在接受輸入buffer,但是仍然在產(chǎn)生輸出的buffer。此時你可以調(diào)用flush()方法,將編解碼器重置于Flushed狀態(tài)。

  3. 調(diào)用stop()將編解碼器返回到未初始化狀態(tài),然后可以重新配置。 完成使用編解碼器后,您必須通過調(diào)用release()來釋放它。

  4. 在極少數(shù)情況下,編解碼器可能會遇到錯誤并轉(zhuǎn)到錯誤狀態(tài)。 這是使用來自排隊(duì)操作的無效返回值或有時通過異常來傳達(dá)的。 調(diào)用reset()使編解碼器再次可用。 您可以從任何狀態(tài)調(diào)用它來將編解碼器移回未初始化狀態(tài)。 否則,調(diào)用 release()動到終端釋放狀態(tài)。

二、MediaCodec API 說明

MediaCodec可以處理具體的視頻流,主要有這幾個方法:

getInputBuffers:獲取需要編碼數(shù)據(jù)的輸入流隊(duì)列,返回的是一個ByteBuffer數(shù)組 
queueInputBuffer:輸入流入隊(duì)列 
dequeueInputBuffer:從輸入流隊(duì)列中取數(shù)據(jù)進(jìn)行編碼操作 
getOutputBuffers:獲取編解碼之后的數(shù)據(jù)輸出流隊(duì)列,返回的是一個ByteBuffer數(shù)組 
dequeueOutputBuffer:從輸出隊(duì)列中取出編碼操作之后的數(shù)據(jù) 
releaseOutputBuffer:處理完成,釋放ByteBuffer數(shù)據(jù) 

三、MediaCodec 流控

3.1 流控基本概念

流控就是流量控制。為什么要控制,因?yàn)闂l件有限!涉及到了 TCP 和視頻編碼:

對 TCP 來說就是控制單位時間內(nèi)發(fā)送數(shù)據(jù)包的數(shù)據(jù)量,對編碼來說就是控制單位時間內(nèi)輸出數(shù)據(jù)的數(shù)據(jù)量。

TCP 的限制條件是網(wǎng)絡(luò)帶寬,流控就是在避免造成或者加劇網(wǎng)絡(luò)擁塞的前提下,盡可能利用網(wǎng)絡(luò)帶寬。帶寬夠、網(wǎng)絡(luò)好,我們就加快速度發(fā)送數(shù)據(jù)包,出現(xiàn)了延遲增大、丟包之后,就放慢發(fā)包的速度(因?yàn)槔^續(xù)高速發(fā)包,可能會加劇網(wǎng)絡(luò)擁塞,反而發(fā)得更慢)。
視頻編碼的限制條件最初是解碼器的能力,碼率太高就會無法解碼,后來隨著 codec 的發(fā)展,解碼能力不再是瓶頸,限制條件變成了傳輸帶寬/文件大小,我們希望在控制數(shù)據(jù)量的前提下,畫面質(zhì)量盡可能高。

一般編碼器都可以設(shè)置一個目標(biāo)碼率,但編碼器的實(shí)際輸出碼率不會完全符合設(shè)置,因?yàn)樵诰幋a過程中實(shí)際可以控制的并不是最終輸出的碼率,而是編碼過程中的一個量化參數(shù)(Quantization Parameter,QP),它和碼率并沒有固定的關(guān)系,而是取決于圖像內(nèi)容。

無論是要發(fā)送的 TCP 數(shù)據(jù)包,還是要編碼的圖像,都可能出現(xiàn)“尖峰”,也就是短時間內(nèi)出現(xiàn)較大的數(shù)據(jù)量。TCP 面對尖峰,可以選擇不為所動(尤其是網(wǎng)絡(luò)已經(jīng)擁塞的時候),這沒有太大的問題,但如果視頻編碼也對尖峰不為所動,那圖像質(zhì)量就會大打折扣了。如果有幾幀數(shù)據(jù)量特別大,但仍要把碼率控制在原來的水平,那勢必要損失更多的信息,因此圖像失真就會更嚴(yán)重。

3.2 Android 硬編碼流控

MediaCodec 流控相關(guān)的接口并不多,一是配置時設(shè)置目標(biāo)碼率和碼率控制模式,二是動態(tài)調(diào)整目標(biāo)碼率(Android 19 版本以上)。

配置時指定目標(biāo)碼率和碼率控制模式:

mediaFormat.setInteger(MediaFormat.KEY_BIT_RATE, bitRate);
mediaFormat.setInteger(MediaFormat.KEY_BITRATE_MODE,
MediaCodecInfo.EncoderCapabilities.BITRATE_MODE_VBR);
mVideoCodec.configure(mediaFormat, null, null, MediaCodec.CONFIGURE_FLAG_ENCODE);

碼率控制模式有三種:

CQ  表示完全不控制碼率,盡最大可能保證圖像質(zhì)量;
CBR 表示編碼器會盡量把輸出碼率控制為設(shè)定值,即我們前面提到的“不為所動”;
VBR 表示編碼器會根據(jù)圖像內(nèi)容的復(fù)雜度(實(shí)際上是幀間變化量的大?。﹣韯討B(tài)調(diào)整輸出碼率,圖像復(fù)雜則碼率高,圖像簡單則碼率低;

動態(tài)調(diào)整目標(biāo)碼率:

Bundle param = new Bundle();
param.putInt(MediaCodec.PARAMETER_KEY_VIDEO_BITRATE, bitrate);
mediaCodec.setParameters(param);
3.3 Android 流控策略選擇

質(zhì)量要求高、不在乎帶寬、解碼器支持碼率劇烈波動的情況下,可以選擇 CQ 碼率控制策略。
VBR 輸出碼率會在一定范圍內(nèi)波動,對于小幅晃動,方塊效應(yīng)會有所改善,但對劇烈晃動仍無能為力;連續(xù)調(diào)低碼率則會導(dǎo)致碼率急劇下降,如果無法接受這個問題,那 VBR 就不是好的選擇。
CBR 的優(yōu)點(diǎn)是穩(wěn)定可控,這樣對實(shí)時性的保證有幫助。所以 WebRTC 開發(fā)中一般使用的是CBR。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • Android 自定義View的各種姿勢1 Activity的顯示之ViewRootImpl詳解 Activity...
    passiontim閱讀 179,001評論 25 709
  • 用兩張圖告訴你,為什么你的 App 會卡頓? - Android - 掘金 Cover 有什么料? 從這篇文章中你...
    hw1212閱讀 13,972評論 2 59
  • 一、文章說明 最近工作實(shí)在太忙,很久沒有更新文章了,收到很多小伙伴催更的消息,心中實(shí)在慚愧,趁著今天有空趕緊更新。...
    風(fēng)從影閱讀 19,297評論 33 118
  • 收拾屋子的時候,看到立在墻角的吉他,女兒好久沒有動過它,上面已經(jīng)蒙了一層灰。我拿了一塊干凈的鹿皮慢慢的輕輕...
    7b2897766be3閱讀 888評論 0 3
  • 生活 是一個牢籠 你 總是從這一個 到另一個 輾轉(zhuǎn)
    簡717閱讀 185評論 0 0

友情鏈接更多精彩內(nèi)容