音頻
數字音頻:采用數字編碼的方式也就是使用0和1來記錄存放、編輯、壓縮或播放音頻的技術。
采樣率:即指在一秒鐘內對聲音信號的采樣次數,它采用赫茲(Hz)來表示,比如44.1KHz采樣率的聲音就是要花費44000個數據點來描述1秒鐘的聲音波形。原則上采樣率越高,聲音質量越好。
采樣得到的數據寫成計算機的數據格式,去除冗余信息者稱之為編碼,再把音頻數據還原成采樣值叫解碼。把某一幅度范圍內的電壓用一個數字表示,這稱之為量化。采樣的值用多少位01表示即為量化精度。
碼率 = 采樣頻率 * 量化精度 * 聲道個數,也就是一秒內數據量。

視頻
連續(xù)的圖像變化每秒超過24幀(Frame)畫面以上時,根據視覺暫留原理,人眼無法辨別單幅的靜態(tài)畫面,看上去時平滑連續(xù)的視覺效果,這樣連續(xù)的畫面的叫做視頻
幀是影像中常用的最小單位,相當于電影中膠片的每一個鏡頭,一幀就是一幅靜止的畫面,連續(xù)的幀就形成了視頻。
幀率:每秒鐘所傳輸圖片的個數,也可以理解為處理器每秒刷新的次數,通常用FPS標識,當然幀數越高,畫面也就越流暢。
轉碼:指將一段多媒體包括音頻、視頻或者其他的內容從一種編碼格式轉換為另外一種編碼格式。(原視頻 -- 解碼 -- 像素數據 -- 編碼 -- 目標視頻)。
視頻編碼:就是文件當中的視頻所采用的壓縮算法,視頻編碼的主要作用是將視頻像素數據(RGB, YUV等)壓縮成為視頻碼流,從而降低視頻的數據量。
其他概念入采樣、采樣率、碼率和音頻類似。
視頻常用的編碼格式:H.265, H.264, MPEG-4d等等,常用的就是H.264
H.264可簡單的概括為幀內壓縮和幀間壓縮
幀內壓縮即可對每個獨立幀中的冗余信息去除,盡可能壓縮圖片尺寸
幀間壓縮:多個幀組合在一起,被稱為GOP,這組圖片中有一張關鍵圖片,被稱為I幀,向前參考,只考慮前面已經處理的幀,被稱為P幀,通過前后幀進行編碼得到的幀被稱為B幀。
所以 I 幀是很關鍵的存在,壓縮 I 幀就可以很容易壓制掉空間的大小,二壓縮 P/B 幀可以壓縮掉時間上的冗余信息。
視頻的清晰度主要和分辨率和碼率正相關,一般分辨率越高,清晰度越高,但超過屏幕分辨率后,視頻分辨率對清晰度沒什么影響了。