超分:
深度學(xué)習(xí)超分辨率最新綜述:一文道盡技術(shù)分類與效果評測
詳解愛奇藝ZoomAI視頻增強(qiáng)技術(shù)的應(yīng)用
使用深度學(xué)習(xí)的單一圖像超分辨率
ESRGAN-進(jìn)擊的超分辨率復(fù)原
音視頻增強(qiáng):
以“用戶播放行為與體驗(yàn)”為核心的視頻服務(wù)質(zhì)量優(yōu)化
運(yùn)動(dòng)模糊濾鏡
關(guān)于HDR,你想知道的全在這
AI新領(lǐng)地—打通圖像增強(qiáng)和視覺識別的“任督二脈”
協(xié)議:
三十年TCP與七年QUIC 誰才是未來?
HLS仍為自適應(yīng)碼率流媒體主導(dǎo)標(biāo)準(zhǔn)
范醒哲:5G時(shí)代是時(shí)候全面解決TCP的效率問題了
熊貓直播P2P分享率優(yōu)化(下):ASN組網(wǎng)
Hulu:如何實(shí)現(xiàn)大型比賽直播系統(tǒng)自動(dòng)擴(kuò)容
基于SRT傳輸協(xié)議的直播服務(wù)
SRT協(xié)議
編解碼:
透過 Top 500 美拍短視頻看 AV1 性能
H.265在花椒直播中的應(yīng)用與優(yōu)化
MediaCodeC解碼視頻指定幀,迅捷、精確
使用MediaExtractor及MediaCodec解碼音視頻
Netflix與英特爾共同發(fā)布開源編解碼器SVT-AV1
Intel可擴(kuò)展視頻技術(shù)(SVT)
MSU高清/極慢檔Codec對比:AV1壓縮效率第一 速度慢
MSU高質(zhì)量編碼對比報(bào)告2018
視頻編碼標(biāo)準(zhǔn)大混戰(zhàn)
Sisvel的VP9/AV1專利池將對視頻行業(yè)帶來哪些影響?
CAE+VBR如何提升用戶體驗(yàn)?
Versatile Video Coding(VVC)總結(jié)
H.265與H.264的差異詳解
H.264/AVC視頻編解碼技術(shù)詳解:宏塊的幀間預(yù)測解碼
H.264/AVC視頻編解碼技術(shù)詳解:參考幀列表
MediaCodec API筆記
H264碼流結(jié)構(gòu)
音視頻編碼技術(shù)基礎(chǔ)
AV1編碼時(shí)間下降,接近使用水平
H264視頻--x264編解碼原理詳解
安卓硬解碼H264播放器的實(shí)現(xiàn)
小視頻app開發(fā)過程中的兩種編碼標(biāo)準(zhǔn)
壓縮效率比H.265更高,揭秘騰訊無線投屏背后的屏幕編碼技術(shù)
iOS硬解碼H264視頻流
H.264 中的 NAL 技術(shù)
音頻:
音頻采樣及編解碼——LPCM 、ADPCM、G711、G726、AAC
ADPCM音頻編解碼
SoundTouch與Rubber Band Library變聲算法對比與ASR結(jié)果分析
從若琪,今天杭州的天氣為例。讓你全面了解什么是語音交互
語音識別:
語音識別
谷歌用新的語音數(shù)據(jù)擴(kuò)增技術(shù)大幅提升語音識別準(zhǔn)確率
語音交互時(shí)代的來臨是NLP技術(shù)無限可能的開始?。?/strong>
語音識別傳統(tǒng)方法(GMM+HMM+NGRAM)概述
語音相似度打分技術(shù)說明
視頻分割與理解:
視頻目標(biāo)分割與跟蹤
FoveaBox:目標(biāo)檢測新紀(jì)元,無Anchor時(shí)代來臨!
移動(dòng)端70+fps!谷歌新出高效實(shí)時(shí)視頻目標(biāo)檢測
視頻檢測(Video Detection)資源列表
滑動(dòng)窗口也能用于實(shí)例分割,陳鑫磊、何愷明等人提出圖像分割新范式
視頻分割在移動(dòng)端的算法進(jìn)展綜述
深度學(xué)習(xí)
如何利用深度學(xué)習(xí)提升視頻轉(zhuǎn)碼效率與視覺質(zhì)量?
機(jī)器學(xué)習(xí)在網(wǎng)絡(luò)擁塞控制中的應(yīng)用
騰訊優(yōu)圖開源人臉檢測算法DSFD,刷新兩項(xiàng)數(shù)據(jù)集紀(jì)錄
醫(yī)學(xué)影像:MIT 利用學(xué)習(xí)圖像變換進(jìn)行數(shù)據(jù)增強(qiáng)
全網(wǎng)最大機(jī)器學(xué)習(xí)數(shù)據(jù)集,視覺、NLP、音頻都在這了
深度學(xué)習(xí)的圖像修復(fù)
清華&美圖開源大規(guī)模視頻分析數(shù)據(jù)集:含11827條視頻,共476個(gè)小時(shí) | CVPR 19
純Deep Learning干貨 | 快慢網(wǎng)絡(luò)用于視頻識別
機(jī)器學(xué)習(xí)中的編碼器-解碼器結(jié)構(gòu)哲學(xué)
face.evoLVe:高性能人臉識別開源庫,內(nèi)附高能模型
開源庫:
- ffmpeg
MPEG中的數(shù)據(jù)壓縮綜述
MPEG系統(tǒng)層回顧
FFmpeg 編譯支持AV1編解碼器libaom-av1
FFmpeg結(jié)構(gòu)與API摘要
MPEG工作回顧和展望
MPEG標(biāo)準(zhǔn)概覽
- webrtc
BBR在實(shí)時(shí)音視頻領(lǐng)域的應(yīng)用
Nodejs+socket.io搭建WebRTC信令服務(wù)器
Google BBR擁塞控制算法背后的數(shù)學(xué)解釋
Chromium 視頻流請求與傳遞過程分析
WebRTC的視頻解碼原理簡析
從通信到AI FreeSWITCH與WebRTC
WebRTC 之ICE淺談
擁塞控制(Congestion Control)算法匯總+ 大牛
WebRTC Android H264編解碼適配
基于OBS的WebRTC H264編碼器
WebRTC音頻降噪使用
WebRTC代碼走讀十(視頻端到端時(shí)延分析)
Smooth Delivery:如何減少網(wǎng)絡(luò)擁塞?
Google WebRtc Android 使用詳解
How Zoom’s web client avoids using WebRTC (DataChannel Update
Google WebRtc Android 使用詳解
opencv
OpenCV中那些深度學(xué)習(xí)模塊x264
X264代碼走讀二(ABR算法碼控)ZLMediaKit
ZLMediaKit高并發(fā)實(shí)現(xiàn)原理Netty
Netty解決粘包和拆包問題的四種方案SRS
SRS-開源流媒體服務(wù)器
音視頻質(zhì)量:
干貨來襲丨音視頻質(zhì)量評估綠皮書
衡量視頻質(zhì)量有哪些指標(biāo)和工具?
EBU超高清視頻主觀測試結(jié)果
以“用戶播放行為與體驗(yàn)”為核心的視頻服務(wù)質(zhì)量優(yōu)化
音視頻分析工具StreamEye介紹
通過端到端的數(shù)據(jù)偵測提升QoS
質(zhì)量三維論如何持續(xù)推進(jìn)騰訊視頻播放體驗(yàn)提升
語音質(zhì)量評價(jià)方法-【音頻質(zhì)量專題】
Intel視頻處理與分析技術(shù)棧和架構(gòu)縱覽
3D/VR/AR/5G:
VRIF最新技術(shù)指南
冼牛:5G的低延遲特性將給多媒體應(yīng)用帶來變革
3D目標(biāo)檢測新框架VoteNet,兩大數(shù)據(jù)集刷新最高精度
超高清論壇(UHD Forum)技術(shù)指南V2.0
蔡銳濤:CG內(nèi)容互動(dòng)與5G的碰撞
三體云周思進(jìn):在紅海中尋找藍(lán)海
MWC2019最全AR/VR匯總:HoloLens 2來襲,5G云VR火爆
5G Americas白皮書—5G開源現(xiàn)狀
AI+AR如何提升花椒直播的體驗(yàn)?
DRM:
如何利用免版稅視頻流技術(shù)構(gòu)建優(yōu)質(zhì)視頻體驗(yàn)?
Web:
Web 實(shí)時(shí)推送技術(shù)的總結(jié)
通過WebAssembly在移動(dòng)端解碼H.265
業(yè)界動(dòng)態(tài):
思科:2022年視頻將占移動(dòng)通信流量79%