在6月20日的華為開發(fā)者大會(HDC 2025)上,華為常務董事、華為云計算 CEO張平安正式發(fā)布盤古大模型5.5,自然語言理解NLP、計算機視覺CV、預測、多模態(tài)、科學計算五大基礎模型全面升級,為行業(yè)提供全新價值。張平安強調,盤古大模型是基于昇騰云的全棧軟硬件訓練而成的,這標志著基于昇騰架構可以打造出世界一流大模型。
華為常務董事、華為云計算 CEO張平安正式發(fā)布盤古大模型5.5
在NLP大模型方面,全新的718B 深度思考模型是一個由256個專家組成的MoE大模型,在知識推理、工具調用、數(shù)學等領域大幅增強,實現(xiàn)能力領先。盤古大模型通過通算掩蓋、全局動態(tài)均衡、分組混合專家MoGE等算法,實現(xiàn)了昇騰親和的高效訓推系統(tǒng),訓練MFU和單卡推理吞吐業(yè)界領先。同時,提出了模型親和的詞表、三明治架構、EP-Group負載均衡loss等技術,實現(xiàn)了不弱于業(yè)界一流模型的競爭力。
盤古大模型5.5在高效長序列、低幻覺、快慢思考融合、Agent等特性上進行升級,提升用戶體驗。例如,盤古提出了自適應快慢思考合一的技術,通過構建難度感知的快慢思考數(shù)據(jù)和兩階段漸進訓練,實現(xiàn)模型根據(jù)問題難易程度自適應地切換快慢思考,簡單問題敏捷回復,復雜問題深度思考,整體模型推理效率提升8倍。盤古深度研究DeepDiver通過長鏈難題合成、漸進式獎勵等關鍵技術,可以在網頁搜索、常識性問答等應用上獲得很高的執(zhí)行效率,如可以在5分鐘內完成超過10跳的復雜問答、生成萬字以上的專業(yè)調研報告等,大幅提升工作效率。
會上,張平安還分享了計算機視覺CV、預測、多模態(tài)、科學計算等基礎模型的技術升級,以及盤古大模型在農業(yè)、工業(yè)、科研等領域的豐富創(chuàng)新應用和落地實踐,持續(xù)深入行業(yè)解難題,成就行業(yè)AI先鋒。
(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )