在6月20日的華為開發者大會(HDC 2025)上,華為常務董事、華為云計算 CEO張平安正式發布盤古大模型5.5,自然語言理解NLP、計算機視覺CV、預測、多模態、科學計算五大基礎模型全面升級,為行業提供全新價值。張平安強調,盤古大模型是基于昇騰云的全棧軟硬件訓練而成的,這標志著基于昇騰架構可以打造出世界一流大模型。

華為常務董事、華為云計算 CEO張平安正式發布盤古大模型5.5
在NLP大模型方面,全新的718B 深度思考模型是一個由256個專家組成的MoE大模型,在知識推理、工具調用、數學等領域大幅增強,實現能力領先。盤古大模型通過通算掩蓋、全局動態均衡、分組混合專家MoGE等算法,實現了昇騰親和的高效訓推系統,訓練MFU和單卡推理吞吐業界領先。同時,提出了模型親和的詞表、三明治架構、EP-Group負載均衡loss等技術,實現了不弱于業界一流模型的競爭力。
盤古大模型5.5在高效長序列、低幻覺、快慢思考融合、Agent等特性上進行升級,提升用戶體驗。例如,盤古提出了自適應快慢思考合一的技術,通過構建難度感知的快慢思考數據和兩階段漸進訓練,實現模型根據問題難易程度自適應地切換快慢思考,簡單問題敏捷回復,復雜問題深度思考,整體模型推理效率提升8倍。盤古深度研究DeepDiver通過長鏈難題合成、漸進式獎勵等關鍵技術,可以在網頁搜索、常識性問答等應用上獲得很高的執行效率,如可以在5分鐘內完成超過10跳的復雜問答、生成萬字以上的專業調研報告等,大幅提升工作效率。
會上,張平安還分享了計算機視覺CV、預測、多模態、科學計算等基礎模型的技術升級,以及盤古大模型在農業、工業、科研等領域的豐富創新應用和落地實踐,持續深入行業解難題,成就行業AI先鋒。