【中國,東莞,2025年6月21日】今日,在華為開發(fā)者大會期間,華為云舉辦了《音視頻AI多模態(tài)融合,媒體重塑行業(yè)數字化新價值》高峰論壇,華為云媒體服務產品部部長呂陽明在高峰論壇上描繪了AI與音視頻技術深度融合所開啟的產業(yè)新圖景。他指出,人工智能走向多模態(tài)融合,從感知理解邁向深度思考與生成創(chuàng)造,推動音視頻產業(yè)進入“智能化、個性化、互動化”的新階段。
華為云媒體服務產品部部長呂陽明解讀AI for Media, Media for AI
雙輪驅動,定義媒體新范式
華為云圍繞媒體核心能力,構建了音視頻、傳輸、建模、推理、渲染五大能力引擎,同時將AI與媒體能力深度融合,重新定義AI時代的媒體生產力。
AI賦能媒體:編解碼+AI(AI MPC)顯著提升畫質,加速超高清普及;渲染+AI實現“In-Scene”個性化廣告;3DGS+AI高效重建毫米級精度的3D數字空間;CG+AI(AIG-3D)突破數據泛化瓶頸,賦能具身智能訓練效率飛躍。
媒體賦能AI:AI+RTC(SparkRTC)升級實時互動體驗;AI+數字人+云會議推動交互從功能邁向情感共生。
技術落地,重塑行業(yè)體驗
華為云展示了多項引領性技術應用場景:
視聽升級:AI MPC技術在同等碼率下大幅提升視覺體驗,HDR Vivid與Audio Vivid技術組合帶來沉浸式音畫享受。
廣告革命:智能廣告替換服務通過AI識別廣告位并實時替換,實現“千人千面”的精準投放,重構直播產業(yè)鏈價值。
3D空間普及:3DGS+AI技術大幅降低數字孿生門檻。用戶僅需手機掃描,即可快速生成毫米級精度的3D物體與空間,推動企業(yè)展廳、文旅導覽、個人Vlog進入沉浸式3D時代。
具身智能加速:面對機器人訓練數據匱乏的挑戰(zhàn),AIG-3D技術可分鐘級生成高精度3D場景,并快速生成海量場景數據,結合物理級仿真引擎,實現訓練數據指數級增長與多技能連貫訓練,突破泛化能力瓶頸。
實時互動無界:SparkRTC重磅升級,實現以不足20Mbps碼率傳輸4K 60幀畫面,支持<70ms超低時延的云游戲、云桌面及智能車聯應用(如遠程泊車)。
智能體進化:融合數字人與云會議能力,華為云智能交互AI Agent具備精準環(huán)境感知、超95%準確率的語義識別及<2秒響應能力,已在酒店管家、會議助手等場景落地,開發(fā)者僅需5行代碼即可快速集成。
突破邊界,共同跨越產業(yè)臨界點
呂陽明強調,AI與媒體的深度互賦能正推動各行業(yè)經歷“物種進化”式躍遷。“我們對外開放五大實時API,將華為在AI與媒體的技術積累賦能伙伴。”呂陽明呼吁業(yè)界攜手,“把華為的技術積累與創(chuàng)新,與客戶和伙伴在行業(yè)深耕多年的經驗結合起來,創(chuàng)造出媒體產業(yè)的更多可能,共赴山海,頂峰相見!”
華為云正以堅實的技術底座與清晰的生態(tài)路徑,引領媒體產業(yè)在智能化浪潮中重塑價值,開啟一個體驗與效能全面躍升的新時代。
(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )