讀書筆記——視頻技術(shù)基礎(chǔ)

人眼視覺和圖像屬性

  1. 人眼的最小視角:1/60°,即sin(1/60°) = 1 / 3400,即觀看距離大于像素寬度的3400倍才能消除像素感


    視覺惰性
  2. 模擬視頻信號本身沒有像素的概念,只有行的概念,只有在數(shù)字化后才具備像素概念
  3. 臨界閃爍頻率,超過此頻率,閃爍感消失
  4. 人眼對亮度的反應(yīng)非線性,其反應(yīng)特性曲線:S=alogI,即對數(shù)曲線,I為線性變化的亮度
  5. 彩色數(shù)字影像一般由三個獨(dú)立通道組成(RGB)
  6. 位深,用來描述每一個通道色彩的二進(jìn)制數(shù)的位數(shù),8位即每個通道有2的8次方,256種色彩,RGB三個通道為2的3x8=24次方種色彩數(shù)
  7. 伽馬矯正,符合人眼視覺特性,且不必增加位深,公式為C=I的(I/Y)次方,Y為常數(shù),I為亮度值,C為編碼值,類似log曲線,與人眼的非線性特點(diǎn)相似,即對暗部亮度變化的分辨力強(qiáng)于亮部


    伽馬曲線
  8. 1080p25,1080行,逐行掃描,每秒掃描25幀;1080i50,1080行數(shù),隔行掃描,每秒掃描50場
  9. 編碼100問題,即人眼對亮度變化的分辨能力為被觀察物體亮度變化達(dá)到背景亮度的1%,根據(jù)人眼的亮度反應(yīng)特性曲線,灰階0-100的編碼范圍內(nèi),亮度變化1,人眼視覺感知變化大于1%,人眼能觀察到階梯現(xiàn)象,為無效編碼


    8bit線性編碼及其亮度變化
  10. 奈奎斯特定律,采樣頻率>2倍的原始信號頻率,才能完整采集;原始信號中> 采樣頻率一半的高頻信號,會映射到低頻部分,產(chǎn)生混疊,如摩爾紋

色彩科學(xué)

  1. 日出時直射陽光的平均色溫2000K;中午時直射陽光的平均色溫:5000K;晴天天空的色溫:9000K-25000K
  2. 三基色原理:幾乎所有自然界中的色光都可以用三種基本色彩混合而成
  3. 色彩科學(xué),即色彩描述系統(tǒng)
  4. 理想黑體,對此加熱時,以電磁波的形式向外輻射能量,但不吸收輻射能,所以其輻射頻譜只與溫度有關(guān)
  5. 標(biāo)準(zhǔn)光源,D65,6500K,更接近于白天的自然光照
  6. RGB計(jì)色制,三基色為RGB,即物理三基色
  7. XYZ計(jì)色制,只有Y包含亮度,因?yàn)閤+y+z=1,所以已知其二,可得第三個變量,即XYZ計(jì)色制的色度值可由xy的二維坐標(biāo)表示,即CIE色度圖
  8. 在CIE色度圖中,可見光色度從波長從380nm到700nm連續(xù)分布,呈馬蹄形


    CIE色度圖
  9. 色彩的重現(xiàn),加色混色法和減色法。絕大部分彩色顯示設(shè)備均采用加色法混色;電影膠片和印刷品采用減色法混色。
  10. 視頻技術(shù)對色彩的描述建立在RGB三基色加色法的基礎(chǔ)上,需要確定三基色和參考白點(diǎn)的具體色度值才能準(zhǔn)確描述某一色彩,sRGB=Rec709
  11. 當(dāng)三基色和參考白點(diǎn)確定后,RGB計(jì)色制與XYZ計(jì)色制可通過三元一次方程組相互轉(zhuǎn)換

感光元件

  1. CCD工作原理,每個像素被光照射以后,MOS電容器的勢阱根據(jù)光照的強(qiáng)度儲存對應(yīng)數(shù)量的電荷,形成潛影(感光);通過控制各個MOS電容器的柵極電壓以實(shí)現(xiàn)特定順序的電荷的轉(zhuǎn)移,最終以電壓的形式輸出至后續(xù)電路進(jìn)行信號處理
  2. CMOS的每一個像素配備獨(dú)立電路,用來完成電荷到電壓的映射(轉(zhuǎn)移)
  3. 動態(tài)范圍,每一個像素能夠記錄的最強(qiáng)與最弱的光照比,CCD因其自身結(jié)構(gòu)(僅由單一的感光單元組成)具有更高的動態(tài)范圍
  4. 拍攝速度CMOS更快,因?yàn)镃MOS芯片自身可以完成大部分光電信號處理
  5. 拜耳模式,單芯片CMOS采用的分光方法,即在每一個像素(感光單元)添加單色濾色鏡,用于記錄某一特定的原色光的強(qiáng)度,(由于人眼對綠光的敏感性要高于紅光和藍(lán)光,所以傳感器上的感綠單元也更多,)缺失的其他兩種色彩需要從臨近的像素中提取,后期經(jīng)過計(jì)算還原
  6. 拜耳模式被目前絕大多數(shù)專業(yè)級單芯片數(shù)字電影攝像機(jī)采用

掃描與同步

  1. 行逆程和場逆程均不記錄或顯示圖像,電子束是截止的,稱之為消隱,且正程掃描時間要遠(yuǎn)大于逆程
  2. 逐行分段幀,PsF,使用隔行掃描設(shè)備,對逐行掃描方式的視頻影像進(jìn)行處理
  3. 消隱期發(fā)送同步脈沖

模擬與數(shù)字

  1. 數(shù)字中間片技術(shù),將膠片影像轉(zhuǎn)換為數(shù)字影像,進(jìn)而在數(shù)字環(huán)境下進(jìn)行剪輯、調(diào)色、特效制作等,其出現(xiàn)于數(shù)字?jǐn)z影機(jī)之前
  2. 在數(shù)字?jǐn)z影機(jī)內(nèi)部,感光器件將連續(xù)的光信號轉(zhuǎn)換為連續(xù)的電信號,后續(xù)電路將電信號轉(zhuǎn)換為電壓并放大,然后對得到的模擬電壓信號進(jìn)行數(shù)字轉(zhuǎn)換,最終轉(zhuǎn)換成串行數(shù)字信號輸出
  3. 在接收端,系統(tǒng)將串行數(shù)字信號轉(zhuǎn)換為并行數(shù)字信號,最終轉(zhuǎn)換為模擬信號輸出
  4. 噪波總是從暗部最先產(chǎn)生的,因?yàn)榱炼鹊?,信號的電壓越低,而噪聲的功率是恒定的?/li>
  5. 模擬信號需經(jīng)過采樣和量化才能轉(zhuǎn)為數(shù)字信號
  6. 量化的本質(zhì)是將模擬量在幅度上進(jìn)行離散化,量化過程中所劃分的區(qū)間數(shù)量成為量化位深,單位為比特。8個量化區(qū)間,其量化位深位3比特。量化級數(shù)越高,所劃分的區(qū)間就越多,量化精度就越高。
  7. 色度采樣有4:4:4、4:2:2、4:2:0等幾種。第一位數(shù)字表示亮度采樣率,后兩位數(shù)字表示兩個色彩分量的采樣率。4:4:4采樣表示每一個像素的亮度和色度都會被單獨(dú)采樣,且亮度和色度的采樣率相同;4:2:2方式的色度采樣頻率是亮度的一半,每隔兩個像素進(jìn)行一次,而沒有進(jìn)行色度采樣的像素的色度信息借用相鄰像素的色度信息或者采樣差值;4:2:0方式的色度采樣頻率為亮度的一半,且一行之內(nèi)只對一個色度分量采樣,下一行再對另一個色度分量采樣。
  8. 越來越多的攝影機(jī)采用4:4:4采樣,而4:2:2采樣是廣播級視頻的專業(yè)標(biāo)準(zhǔn)。
  9. 上變換,從低分辨率轉(zhuǎn)換到高分辨率,下變換則相反。

視頻傳輸

  1. 低頻系帶信號(調(diào)制信號)往往不能直接傳輸,必須依附于一個高頻信號(載波)以便于傳輸;調(diào)制是通過改變高頻載波的幅度、相位或頻率,使其隨系帶信號幅度的變化而變化。
  2. 雙邊帶調(diào)制、單邊帶調(diào)制和殘留邊帶調(diào)制
  3. 正交幅度調(diào)制

視頻標(biāo)準(zhǔn)與視頻格式

  1. Rec.709,最通用的高清數(shù)字視頻標(biāo)準(zhǔn),畫面寬高比16:9,總行數(shù)1080行,像素為正方形;具有8位或者10位位深;幀速率為60Hz、50Hz、30Hz、25Hz、24Hz

視頻存儲

  1. 磁帶,視頻電信號和磁跡強(qiáng)度的變化二者間的相互轉(zhuǎn)化

時間與時碼

  1. 50i(每秒25幀或50場,兩場為一幀)與24p相互轉(zhuǎn)換的方法:改變播放速度
  2. 24p轉(zhuǎn)60i(30p):每4幀24p影像中增加1幀,即將4幀24p畫面轉(zhuǎn)換為5幀60i畫面,一般使用2:3下拉變換實(shí)現(xiàn);30p轉(zhuǎn)24p是其逆過程。


    下拉變換
  3. 對于60i(30p)的NTSC制而言,實(shí)際的幀速率為29.97Hz,降低千分之一。
  4. LTC,磁帶上以水平連續(xù)的方式記錄
  5. VITC,利用視頻信號場消隱間隙中的行掃描線進(jìn)行時碼信息的記錄,是不連續(xù)的
  6. Record Run模式,鏡頭之間的時碼是不間斷的
  7. Time of Day,記錄自然時間;Free Run模式可以將任意時間作為起始時間

顯示

  1. 液晶態(tài),既有液體的流動性,又有固體的晶體性質(zhì),是一種穩(wěn)態(tài)

伽馬

  1. 人眼的亮度感覺與亮度的關(guān)系:近似對數(shù)曲線
    S= klogI + k


    人眼的亮度感覺與亮度的關(guān)系
  2. 對于CRT顯示器,其亮度和電壓的關(guān)系:近似指數(shù)曲線


    亮度和電壓

    說明其特性與人眼剛好相反。顯示器的這種指數(shù)特性又叫伽馬;當(dāng)被攝物體通過具有線性特性的感光器件后,未經(jīng)校正直接由指數(shù)型的顯示器輸出后,被攝物體亮度的線性被改變?yōu)榉蔷€性(指數(shù)),造成非線性失真

  3. 伽馬矯正


    伽馬矯正
  4. 在攝像機(jī)內(nèi)部進(jìn)行伽馬矯正可以有效提高暗部信噪比
  5. 系統(tǒng)伽馬,即攝像設(shè)備的伽馬矯正和顯示設(shè)備的伽馬疊加:


    系統(tǒng)伽馬

    系統(tǒng)伽馬>1,對比度和飽和度越大

  6. 視頻伽馬對1—90亮度記錄范圍為0-100IRE,超出部分未、為100-109IRE,對于超出100的亮度信息,壓縮至109IRE記錄
  7. 電影伽馬(對數(shù)伽馬)
    V1 = klogV2+a,V1為校正后的電壓,V2為校正前的電壓,由于V2與亮度成線性關(guān)系,所以V1與亮度成對數(shù)關(guān)系


    電影伽馬與視頻伽馬對比
  8. 對數(shù)影像在標(biāo)準(zhǔn)Rec709的顯示器不能正確還原,其根本原因在于二者的伽馬差異巨大,所以需要認(rèn)為校正電影伽馬。
  9. LUT轉(zhuǎn)換原理圖


    LUT轉(zhuǎn)換原理圖

    LUT是將電影伽馬轉(zhuǎn)換為視頻伽馬的函數(shù)。

  10. 由感光元件輸出的電壓首先進(jìn)行數(shù)模轉(zhuǎn)換,形成14比特或16比特的數(shù)字信號,然后進(jìn)行線性到對數(shù)的轉(zhuǎn)換,轉(zhuǎn)換的同時量化位深下降為10比特。
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容