字節(jié)跳動AVG編碼技術新突破:讓視頻縮小13%

3月1日消息,據聯合視頻專家組JVET官網顯示,字節(jié)跳動AVG(先進視頻團隊)今年2月發(fā)起一項視頻壓縮的技術提案,該提案能夠在優(yōu)化壓縮質量的同時,節(jié)約至少13%的存儲和帶寬。例如,一段180分鐘H.266/VVC標準的高清視頻(1080P分辨率),大約需要3GB的數據體積,應用新技術后只需要2.6GB。

視頻是由一張張圖片連接起來的動態(tài)圖像序列,視頻編解碼則是視頻應用的底層核心技術,作用是對圖像進行壓縮和數字編碼,以盡可能小的帶寬傳送高質量的視頻數據。H.266/VVC能夠在不影響畫質的情況下,把視頻碼率降低到前一代標準H.265/HEVC的一半。本來只夠放標清視頻的網速,也能流暢播放高清視頻。

此次字節(jié)跳動AVG提出的新算法,旨在通過深度學習技術構建減少視頻壓縮失真的濾波器(DAM),主干是基于殘差單元堆疊的深度卷積網絡,輔以自適應模型選擇以最大程度適應特性復雜的自然視頻。所謂殘差單元是指通過引入跳層連接,允許網絡把注意力放在變化的殘差上,這與視頻圖像幀之間的殘差有異曲同工之妙,比如武林高手決斗,“劍光一閃”,每一幀圖像絕大部分內容是相同的,閃動的劍光形成殘差,這也是視頻編碼壓縮的重點關注對象。

實驗結果顯示,相比H.266/VVC最新標準,字節(jié)跳動的DAM解決方案能夠為視頻編碼性能帶來顯著提升,亮度信號Y可實現10.28%的性能增益,兩個色度信號U和V,性能增益也分別達到28.22%和27.97%,在視頻質量有所優(yōu)化的同時,至少還可縮小13%的數據體積。

據悉,AVG的各項研究成果,也將通過BVC編碼器的升級換代投入應用,包括抖音、西瓜視頻、今日頭條等App的視頻類內容處理,以及云計算、云游戲等基礎架構領域。

根據公開報道,字節(jié)跳動AVG在美國加州建立研發(fā)團隊,成員有來自高通、微軟、英特爾等巨頭的資深研究員,也有出身海內外頂級院校的新生代。在此前JVET制定新一代國際視頻編解碼標準H.266/VVC的過程中,字節(jié)跳動AVG累計提交260+項技術提案,其中130+項被采納,被采納提案數和采納率均排在世界前列,是H.266/VVC核心算法的主要貢獻者之一。

2021-03-01
字節(jié)跳動AVG編碼技術新突破:讓視頻縮小13%
3月1日消息,據聯合視頻專家組JVET官網顯示,字節(jié)跳動AVG(先進視頻團隊)今年2月發(fā)起一項視頻壓縮的技術?

長按掃碼 閱讀全文