1. 幀(Frame)
幀是構(gòu)成視頻的基本單元,就像動(dòng)畫書里的單頁圖片。視頻就是由連續(xù)不斷的幀快速播放形成的,當(dāng)我們看到連續(xù)變化的畫面時(shí),實(shí)際上就是在看連續(xù)的幀。
2. 幀率(Frame Rate)
幀率是指視頻每秒鐘播放多少幀,通常用“fps”(Frames Per Second)表示。例如,24fps意味著視頻每秒播放24個(gè)獨(dú)立的圖像。較高的幀率可以帶來更流暢的視覺體驗(yàn),比如電影常用24fps,而很多現(xiàn)代電視和游戲追求60fps或更高。
3. 分辨率(Resolution)
分辨率是指視頻畫面的像素?cái)?shù)量,通常以寬度乘以高度的形式給出,例如1920x1080(也稱作1080p)。更高的分辨率意味著更多的細(xì)節(jié)和更清晰的畫面。
4. 編碼與壓縮(Encoding & Compression)
編碼是將原始視頻數(shù)據(jù)轉(zhuǎn)化為適合存儲(chǔ)和傳輸?shù)母袷降倪^程,常見的編碼格式有H.264、HEVC(H.265)、VP9等。
壓縮是為了減少視頻文件大小的一種技術(shù),通過去除重復(fù)信息、降低色彩豐富度等方式減少數(shù)據(jù)量。壓縮分為無損壓縮(不會(huì)損失原始數(shù)據(jù)質(zhì)量)和有損壓縮(在不影響觀感前提下犧牲部分質(zhì)量)。
5. 音頻采樣率與位深度(Sampling Rate & Bit Depth)
采樣率指每秒鐘記錄或播放音頻樣本的數(shù)量,常用的如44.1kHz(CD音質(zhì))或48kHz。采樣率越高,音質(zhì)理論上越接近原聲。
位深度決定了每個(gè)音頻樣本可以表達(dá)的聲音動(dòng)態(tài)范圍,如16位、24位等。位深度越大,能表達(dá)的音量變化越細(xì)膩。
6. 音頻編碼(Audio Encoding)
音頻編碼類似于視頻編碼,常見的音頻編碼格式有AAC、MP3、FLAC、Opus等,不同的編碼格式有不同的壓縮效率和音質(zhì)表現(xiàn)。
7. 色彩空間(Color Space)
色彩空間是用來描述顏色的方式,如RGB(紅綠藍(lán))用于屏幕顯示,YUV(亮度、藍(lán)色差、紅色差)用于視頻壓縮和廣播。
8. 同步(Synchronization)
音視頻同步是指確保音頻和視頻在同一時(shí)間點(diǎn)上正確匹配,避免出現(xiàn)音畫不同步的現(xiàn)象。
9. 流媒體(Streaming Media)
流媒體技術(shù)允許音頻或視頻內(nèi)容在網(wǎng)絡(luò)上邊下載邊播放,無需等待整個(gè)文件下載完畢,如HLS、MPEG-DASH等流媒體協(xié)議。
10. P2P傳輸(Peer-to-Peer Transmission)
P2P是點(diǎn)對(duì)點(diǎn)傳輸技術(shù),讓網(wǎng)絡(luò)中的設(shè)備相互直接交換數(shù)據(jù),減少了對(duì)中央服務(wù)器的依賴,如在WebRTC技術(shù)中用于實(shí)時(shí)音視頻通信。
11. CDN(Content Delivery Network)
CDN是一種分布式網(wǎng)絡(luò)服務(wù),它將音視頻內(nèi)容緩存在全球各地的服務(wù)器上,用戶可以從離自己最近的服務(wù)器獲取內(nèi)容,以減少延遲和提高傳輸質(zhì)量。
12. 數(shù)字版權(quán)管理(DRM, Digital Rights Management)
DRM是一種技術(shù)手段,用于保護(hù)數(shù)字內(nèi)容(如音視頻)免遭非法復(fù)制和分發(fā),確保版權(quán)所有者的權(quán)益不受侵犯。
13. WebRTC(Web Real-Time Communication)
WebRTC是一種開源項(xiàng)目,通過瀏覽器提供實(shí)時(shí)音視頻通信功能,無需安裝插件,實(shí)現(xiàn)了點(diǎn)對(duì)點(diǎn)的實(shí)時(shí)音視頻聊天和數(shù)據(jù)共享。
14. I幀、P幀、B幀(Keyframe, Predicted Frame, Bidirectional Frame)
I幀(關(guān)鍵幀)是可以獨(dú)立解碼的幀,不需要參考其它幀的信息。
P幀(預(yù)測(cè)幀)需要參考前面的一個(gè)I幀或P幀,通過運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)來解碼。
B幀(雙向預(yù)測(cè)幀)是最復(fù)雜的,它既需要參考前面的幀,也需要參考后面的幀來解碼,可以提供更高的壓縮效率,但解碼時(shí)序較復(fù)雜。
15. GOP(Group of Pictures)
GOP是一組連續(xù)的視頻幀,包括一個(gè)I幀和其他P幀或B幀。它是視頻壓縮編碼中的一個(gè)重要參數(shù),影響編碼效率和隨機(jī)訪問性能。
16. 音頻通道與聲道(Audio Channels & Tracks)
音頻通道是指音頻信號(hào)在混合和處理時(shí)的空間位置,如立體聲就有左聲道和右聲道,環(huán)繞聲有更多的聲道。
聲道是指音頻文件中獨(dú)立的音頻流,如一首歌的主唱、伴奏可能是兩個(gè)不同的聲道。
17. ABR(Adaptive Bitrate Streaming)
ABR是一種自適應(yīng)碼率流媒體技術(shù),可以根據(jù)用戶的網(wǎng)絡(luò)狀況自動(dòng)選擇合適碼率的視頻流,保證觀看體驗(yàn)的同時(shí)減少卡頓。
18. FEC(Forward Error Correction)
FEC是前向糾錯(cuò)技術(shù),通過在傳輸數(shù)據(jù)中加入冗余信息,使接收端即使在收到少量錯(cuò)誤數(shù)據(jù)也能自行糾正錯(cuò)誤,常用于網(wǎng)絡(luò)傳輸?shù)目煽啃栽鰪?qiáng)。
19. STB(Set-Top Box)
STB機(jī)頂盒是家庭寬帶接入電視機(jī)的一種設(shè)備,它可以接收、解碼和播放來自衛(wèi)星、有線電視網(wǎng)絡(luò)或互聯(lián)網(wǎng)的各種音視頻信號(hào)。
20. DRM(Digital Rights Management)系統(tǒng)
DRM系統(tǒng)不僅包括內(nèi)容加密,還包括許可證頒發(fā)、用戶權(quán)限管理等一整套機(jī)制,確保付費(fèi)音視頻內(nèi)容只能被合法購買的用戶按約定條件使用。
21. 視頻編碼標(biāo)準(zhǔn)(Video Coding Standards)
如H.264/MPEG-4 AVC、HEVC/H.265、VP8、VP9和最新的AV1等,這些都是視頻壓縮編碼標(biāo)準(zhǔn),用來減小視頻文件的大小,同時(shí)盡量保持原有的圖像質(zhì)量。
22. 音頻編碼標(biāo)準(zhǔn)(Audio Coding Standards)
如AAC、MP3、Ogg Vorbis、Opus、FLAC(無損壓縮)以及杜比AC-3、杜比TrueHD、DTS等環(huán)繞聲編碼標(biāo)準(zhǔn),它們決定了音頻文件的壓縮方式和音質(zhì)。
23. 音頻編解碼器(Audio Codec)
如AAC編碼器和解碼器、MP3編解碼器等,它們負(fù)責(zé)音頻信號(hào)的壓縮編碼和解碼還原。
24. 視頻封裝格式(Container Formats)
如MP4、MKV、AVI、FLV等,它們將音頻流、視頻流以及其他元數(shù)據(jù)打包在一起,便于傳輸和播放。
25. 視頻編碼層次結(jié)構(gòu)(Video Coding Hierarchy)
包括宏塊(Macroblock)、片(Slice)、層(Layer)等概念,這些層級(jí)結(jié)構(gòu)的設(shè)計(jì)有利于視頻編碼的高效壓縮和靈活處理。
26. 混響與降噪(Reverb & Noise Reduction)
在音頻處理中,混響是模擬聲音在封閉空間內(nèi)反射的效果,而降噪則是去除背景噪音,提高音頻純凈度的技術(shù)。
27. 網(wǎng)絡(luò)傳輸協(xié)議(Network Protocols)
如TCP/IP用于可靠的數(shù)據(jù)傳輸,UDP用于實(shí)時(shí)傳輸,RTP/RTCP用于音視頻流的實(shí)時(shí)傳輸,HTTP用于點(diǎn)播和直播的流媒體傳輸。
28. CEA-608/CEA-708字幕
這是兩種美國(guó)電視行業(yè)的字幕標(biāo)準(zhǔn),用于在視頻流中嵌入字幕信息。
29. 多屏互動(dòng)與投屏技術(shù)
如Miracast、DLNA、AirPlay等技術(shù),允許用戶將音視頻內(nèi)容從一臺(tái)設(shè)備無線傳輸?shù)搅硪慌_(tái)設(shè)備上播放。
30. VR/AR音視頻處理
在虛擬現(xiàn)實(shí)和增強(qiáng)現(xiàn)實(shí)中,音視頻處理技術(shù)需要考慮三維空間定位、頭部跟蹤、全景視頻、3D音頻等特殊要求。
31. 360°全景視頻
全景視頻是一種可以提供全方位視角的視頻格式,觀眾可以根據(jù)自己的意愿自由選擇觀看的角度,常見于VR(虛擬現(xiàn)實(shí))應(yīng)用。
32. HDR(High Dynamic Range)
高動(dòng)態(tài)范圍是視頻質(zhì)量提升的重要標(biāo)志,HDR視頻提供了更大的亮度范圍和更豐富的色彩深度,使得亮部和暗部細(xì)節(jié)都能得到更好的展現(xiàn)。
33. EPG(Electronic Program Guide)
電子節(jié)目指南是數(shù)字電視、IPTV等服務(wù)中的一個(gè)重要組成部分,它提供頻道列表、節(jié)目預(yù)告及詳情等功能,方便用戶查找和預(yù)約觀看節(jié)目。
34. 音頻后期制作
包括混音、母帶處理、音效設(shè)計(jì)等步驟,這些是對(duì)原始錄音進(jìn)行精細(xì)化加工和藝術(shù)創(chuàng)作的過程,以達(dá)到最佳聽覺效果。
35. AI在音視頻處理中的應(yīng)用
包括但不限于AI驅(qū)動(dòng)的視頻超分辨率、噪聲消除、語音識(shí)別、語音合成、視頻內(nèi)容分析和智能剪輯等技術(shù)。
36. 低延遲實(shí)時(shí)通信
對(duì)于音視頻會(huì)議、在線教育、直播等應(yīng)用場(chǎng)景,低延遲通信技術(shù)至關(guān)重要,如WebRTC和QUIC等協(xié)議致力于減少音視頻數(shù)據(jù)在網(wǎng)絡(luò)傳輸中的延遲。
37. QoS(Quality of Service)和QoE(Quality of Experience)
QoS是指網(wǎng)絡(luò)服務(wù)提供商對(duì)服務(wù)質(zhì)量的承諾,確保音視頻數(shù)據(jù)的可靠傳輸;QoE則是用戶體驗(yàn)層面的質(zhì)量評(píng)估,關(guān)注的是用戶實(shí)際感受到的音視頻質(zhì)量。
38. 視頻拼接與融合
在大型活動(dòng)直播、監(jiān)控系統(tǒng)中,常常需要將多個(gè)攝像頭拍攝的視頻畫面無縫拼接起來,形成一個(gè)完整的畫面。
39. 直播推流與拉流
推流是將音視頻源發(fā)送至流媒體服務(wù)器的過程,拉流是從服務(wù)器接收并播放音視頻流的過程。
40. 雙向互動(dòng)直播
用戶不僅可以觀看直播,還能通過評(píng)論、點(diǎn)贊、送禮等方式參與互動(dòng),甚至在某些平臺(tái)上還可以進(jìn)行連麥、投票等更加深度的互動(dòng)體驗(yàn)。