隨著人工智能(AI)和高性能計算(HPC)的快速發(fā)展,對網(wǎng)絡(luò)基礎(chǔ)設(shè)施的要求越來越高。傳統(tǒng)的以太網(wǎng)技術(shù)在面對大規(guī)模并行計算和海量數(shù)據(jù)傳輸時逐漸暴露出性能瓶頸。為了解決這些問題,超級以太網(wǎng)(UltraEthernet)應(yīng)運而生。超級以太網(wǎng)通過優(yōu)化網(wǎng)絡(luò)架構(gòu)和協(xié)議棧,大幅提升了網(wǎng)絡(luò)性能,為下一代人工智能工作負(fù)載提供了強大的支持。
超級以太網(wǎng)的背景與需求
人工智能與高性能計算的挑戰(zhàn)
現(xiàn)代人工智能模型的規(guī)模和復(fù)雜性不斷增加,例如,一些生成式AI模型的參數(shù)量已達到數(shù)萬億個。這些模型的訓(xùn)練和推理需要在大規(guī)模計算集群上進行,對網(wǎng)絡(luò)的帶寬、延遲和可擴展性提出了極高要求。傳統(tǒng)的以太網(wǎng)技術(shù)在面對這些需求時,往往無法滿足高性能計算和AI工作負(fù)載的苛刻要求。
超級以太網(wǎng)聯(lián)盟的成立
為了應(yīng)對這些挑戰(zhàn),2023年7月,Linux基金會宣布成立超級以太網(wǎng)聯(lián)盟(UltraEthernetConsortium,UEC),其創(chuàng)始成員包括英特爾、AMD、惠普企業(yè)、Arista、Broadcom、思科、Meta和微軟等。該聯(lián)盟的目標(biāo)是開發(fā)一個基于以太網(wǎng)的開放、可互操作、高性能的全通信堆棧架構(gòu),以滿足大規(guī)模人工智能和高性能計算的網(wǎng)絡(luò)需求。
超級以太網(wǎng)的技術(shù)特點
優(yōu)化的傳輸層協(xié)議
超級以太網(wǎng)聯(lián)盟計劃開發(fā)一種新的傳輸層協(xié)議——超級以太網(wǎng)傳輸(UltraEthernetTransport,UET),以取代現(xiàn)有的基于以太網(wǎng)的RDMAoverConvergedEthernet(RoCE)協(xié)議。UET協(xié)議將支持以下特性:
多路徑和分組噴射:通過同時利用所有可用路徑傳輸數(shù)據(jù)包,實現(xiàn)更高效的網(wǎng)絡(luò)利用率。
靈活的傳輸順序:允許數(shù)據(jù)包亂序傳輸,減少尾延遲。
現(xiàn)代擁塞控制機制:優(yōu)化網(wǎng)絡(luò)擁塞管理,確保在高負(fù)載下仍能保持低延遲。
增強的物理層和鏈路層
超級以太網(wǎng)不僅優(yōu)化了傳輸層協(xié)議,還對物理層和鏈路層進行了改進。這些改進包括更高的帶寬、更低的延遲以及更高效的信號傳輸技術(shù)。通過這些優(yōu)化,超級以太網(wǎng)能夠在硬件層面大幅提升網(wǎng)絡(luò)性能,滿足大規(guī)模AI和HPC工作負(fù)載的需求。
軟件層的優(yōu)化
超級以太網(wǎng)的軟件層優(yōu)化主要體現(xiàn)在對AI和HPC工作負(fù)載的深度支持上。聯(lián)盟正在開發(fā)相關(guān)的API和數(shù)據(jù)結(jié)構(gòu),以確保超級以太網(wǎng)能夠無縫集成到現(xiàn)有的AI框架和HPC庫中。這意味著用戶無需對現(xiàn)有的工作負(fù)載進行大規(guī)模修改,即可遷移到超級以太網(wǎng)架構(gòu)。
超級以太網(wǎng)的應(yīng)用案例
數(shù)據(jù)中心網(wǎng)絡(luò)優(yōu)化
超級以太網(wǎng)在數(shù)據(jù)中心的應(yīng)用主要體現(xiàn)在對網(wǎng)絡(luò)架構(gòu)的優(yōu)化上。通過采用超級以太網(wǎng)技術(shù),數(shù)據(jù)中心能夠?qū)崿F(xiàn)更高的網(wǎng)絡(luò)利用率和更低的延遲。例如,騰訊云在實踐中通過優(yōu)化網(wǎng)絡(luò)架構(gòu),實現(xiàn)了超過90%的網(wǎng)絡(luò)利用率。這種優(yōu)化不僅降低了數(shù)據(jù)中心的運營成本,還顯著提升了AI訓(xùn)練的效率。
大規(guī)模AI訓(xùn)練
在大規(guī)模AI訓(xùn)練場景中,超級以太網(wǎng)能夠顯著提升模型訓(xùn)練的速度和效率。通過支持多路徑傳輸和靈活的分組順序,超級以太網(wǎng)能夠更好地應(yīng)對大規(guī)模并行計算中的數(shù)據(jù)傳輸需求。例如,NVIDIA推出的BlueField-3SuperNIC和Spectrum-4交換機系統(tǒng),專為AI工作負(fù)載優(yōu)化,能夠提供高達400Gb/s的網(wǎng)絡(luò)帶寬。
高性能計算
超級以太網(wǎng)在高性能計算中的應(yīng)用主要體現(xiàn)在對計算集群的優(yōu)化上。通過采用超級以太網(wǎng)技術(shù),計算集群能夠?qū)崿F(xiàn)更高的計算效率和更低的延遲。例如,惠普企業(yè)(HPE)正在利用超級以太網(wǎng)技術(shù)優(yōu)化其高性能計算解決方案,以滿足大規(guī)??茖W(xué)計算和工程模擬的需求。
超級以太網(wǎng)的優(yōu)勢
高性能
超級以太網(wǎng)通過優(yōu)化傳輸層協(xié)議和物理層技術(shù),大幅提升了網(wǎng)絡(luò)的帶寬和延遲性能。例如,NVIDIA的SuperNIC能夠提供高達800Gb/s的網(wǎng)絡(luò)帶寬,顯著提升了AI工作負(fù)載的效率。
可擴展性
超級以太網(wǎng)的架構(gòu)設(shè)計使其能夠輕松擴展以滿足大規(guī)模計算需求。通過支持多路徑傳輸和靈活的分組順序,超級以太網(wǎng)能夠在大規(guī)模計算集群中實現(xiàn)高效的負(fù)載均衡。
互操作性
超級以太網(wǎng)聯(lián)盟致力于開發(fā)一個開放、可互操作的網(wǎng)絡(luò)架構(gòu)。這意味著不同的硬件和軟件供應(yīng)商能夠在其基礎(chǔ)上開發(fā)兼容的產(chǎn)品,從而推動整個行業(yè)的技術(shù)創(chuàng)新。
成本效益
超級以太網(wǎng)在提升性能的同時,還注重成本效益。通過優(yōu)化網(wǎng)絡(luò)架構(gòu)和協(xié)議棧,超級以太網(wǎng)能夠在不增加過多成本的情況下,顯著提升網(wǎng)絡(luò)性能。例如,騰訊云通過優(yōu)化網(wǎng)絡(luò)架構(gòu),實現(xiàn)了超過90%的網(wǎng)絡(luò)利用率,顯著降低了數(shù)據(jù)中心的運營成本。
超級以太網(wǎng)的未來展望
技術(shù)創(chuàng)新
超級以太網(wǎng)聯(lián)盟正在不斷推進技術(shù)創(chuàng)新,以滿足未來人工智能和高性能計算的需求。例如,聯(lián)盟正在開發(fā)新的傳輸層協(xié)議和優(yōu)化的物理層技術(shù),以進一步提升網(wǎng)絡(luò)性能。
行業(yè)合作
超級以太網(wǎng)的發(fā)展離不開行業(yè)的廣泛合作。聯(lián)盟成員包括英特爾、AMD、惠普企業(yè)、Arista、Broadcom、思科、Meta和微軟等。這些行業(yè)巨頭的合作將推動超級以太網(wǎng)技術(shù)的快速普及和應(yīng)用。
市場前景
隨著人工智能和高性能計算市場的快速增長,超級以太網(wǎng)的市場前景廣闊。研究公司650Group預(yù)計,數(shù)據(jù)中心AI網(wǎng)絡(luò)市場規(guī)模將在未來幾年內(nèi)顯著增長。超級以太網(wǎng)技術(shù)的普及將為相關(guān)企業(yè)帶來巨大的市場機會。
總結(jié)
超級以太網(wǎng)的興起為下一代人工智能和高性能計算工作負(fù)載提供了強大的支持。通過優(yōu)化傳輸層協(xié)議、增強物理層和鏈路層以及優(yōu)化軟件層,超級以太網(wǎng)能夠顯著提升網(wǎng)絡(luò)性能。在數(shù)據(jù)中心、大規(guī)模AI訓(xùn)練和高性能計算等領(lǐng)域,超級以太網(wǎng)已經(jīng)展現(xiàn)出顯著的優(yōu)勢。隨著技術(shù)創(chuàng)新的不斷推進和行業(yè)的廣泛合作,超級以太網(wǎng)將在未來發(fā)揮更大的作用。
- 藍牙信道探測:室內(nèi)傳感領(lǐng)域的一場靜悄悄的革命
- 混合云到底是什么?為什么越來越多企業(yè)都在用?
- 物聯(lián)網(wǎng)合規(guī)指南:應(yīng)對當(dāng)今監(jiān)管挑戰(zhàn)的策略與實踐
- 醫(yī)療物聯(lián)網(wǎng)如何重塑患者安全
- 為什么要構(gòu)建能源系統(tǒng)的網(wǎng)絡(luò)彈性
- SRv6核心標(biāo)準(zhǔn)RFC9800發(fā)布,互聯(lián)網(wǎng)技術(shù)又一次飛躍
- 千家周報|上周熱門資訊 排行榜(06月30日-07月06日)
- 從自動化到自治化:Agentic AI重塑工業(yè)未來
- 國產(chǎn)機器狗速度突破每秒10米,刷新世界記錄;聯(lián)通發(fā)布智慧社區(qū)平臺3.0 助力未來社區(qū)建設(shè)——2025年07月07日
- 自動化2025:重塑世界的四大自動化力量
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。