中國聯(lián)通發(fā)布全球最長距離大模型異構混訓成果

7月19日,在2025中國聯(lián)通合作伙伴大會期間,中國聯(lián)通研究院聯(lián)合上海人工智能實驗室等合作伙伴,正式發(fā)布了全球最長距離大模型異構混訓試驗成果,向業(yè)界展現(xiàn)了中國聯(lián)通在智算網絡關鍵技術領域的里程碑,為智算產業(yè)的高質量發(fā)展注入新范式。

隨著人工智能技術的高速發(fā)展和大模型時代的加速來臨,模型訓練對算力基礎設施的高吞吐、低時延、高性能提出了更高要求。然而,當前算力資源呈現(xiàn)出異構化和多中心化的格局,面臨著跨域資源互聯(lián)互通機制不健全、長距離傳輸存在帶寬與時延瓶頸、異構資源統(tǒng)一調度與高效融合能力有限等挑戰(zhàn)。

在此背景下,中國聯(lián)通聯(lián)合上海人工智能實驗室,阿里云、浪潮、基流科技、加佳科技等行業(yè)合作伙伴,面向國產異構GPU環(huán)境,針對超大模型跨域訓練和碎片化算力整合需求,依托“算力智聯(lián)網AINet長距無損傳輸技術優(yōu)勢,結合上海人工智能實驗室“DeepLink” 超大規(guī)模跨域混訓技術方案,在上海臨港和山東濟南鮑山數(shù)據(jù)中心間構建長度超1500公里的跨域異構混訓系統(tǒng);通過自動調整多種并行策略和跨域收斂比下MoE模型和Dense模型的參數(shù)配置,完成了1500公里跨域的千億參數(shù)AI大模型異構混訓試驗,經驗證等效算力可達單芯片單集群等效算力的95%以上。在算力互聯(lián)層面,采用聯(lián)通自研內置長距RDMA協(xié)議棧的RoCE交換機,兼顧DC內和DC間高性能網絡需求;在算力調度與資源管理層面,通過聯(lián)通“智馭”平臺實現(xiàn)對跨域網絡和集群的統(tǒng)一管控及任務調度;在算力協(xié)同層面,基于DeepLink在訓練加速、異構通信、并行策略等核心技術,實現(xiàn)千億參數(shù)大模型在超長距離異構GPU環(huán)境下的高效訓練。

上述成果標志著中國聯(lián)通在算力基礎設施跨域協(xié)同調度、異構資源融合與高性能分布式訓練等關鍵領域實現(xiàn)了實質性技術突破,為下一代互聯(lián)網產業(yè)發(fā)展奠定堅實基礎。面向未來,中國聯(lián)通將錨定“世界一流科技服務企業(yè)”戰(zhàn)略目標,持續(xù)深耕智算基礎設施和下一代互聯(lián)網領域關鍵技術,攜手產學研用各界合作伙伴,從組網、協(xié)議、管控等方面,共同推動智算網絡核心技術突破、前沿應用場景落地與生態(tài)體系建設。

免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

2025-07-19
中國聯(lián)通發(fā)布全球最長距離大模型異構混訓成果
中國聯(lián)通發(fā)布全球最長距離大模型異構混訓成果,7月19日,在2025中國聯(lián)通合作伙伴大會期間,中國聯(lián)通研究院聯(lián)合上海人工智能實驗室等合作伙伴,正式

長按掃碼 閱讀全文