上證報11月16日獲悉,華為將于下周舉辦2025 AI容器應用落地與發展論壇,會上將發布AI領域突破性技術成果,相關技術有望解決算力資源利用效率難題。
據透露,該技術延續 “以軟件補硬件” 的創新思路,可將GPU、NPU等算力資源利用率從行業平均30%-40%大幅提升至70%,顯著釋放算力硬件潛能。
據了解,華為這項新技術將對標英偉達2024年底收購的以色列公司Run: ai的核心技術,旨在通過軟件創新,實現英偉達、昇騰以及其他三方算力的統一資源管理與利用,“屏蔽”算力硬件差異,為AI訓練推理提供更高效的資源支撐。
2024年12月,英偉達宣布以7億美元(約合人民幣51億元)價格,收購2018年成立的以色列公司Run:ai。Run:ai的核心產品是基于kubernetes(開源容器編排平臺)構建的軟件平臺,用于調度GPU的計算資源,通過動態調度、池化、分片等技術,實現GPU資源利用率的優化,讓深度學習訓練與推理任務在企業級環境中高效運行。
在先進制程受限、單顆芯片算力與國外有差距的背景下,華為積極軟件創新上使力,希望通過“以系統補單點”“以軟件補硬件”,彌補芯片方面的不足。11月11日,華為公布的第六屆“十大發明”評選結果里,排名第一的Scale-up超大規模超節點算力平臺就是用系統架構和互聯技術彌補單芯性能短板的技術之一。(詳見本報此前報道華為公布“十大發明”,涉及算力、存儲等技術)
上述發明將超節點內的異構并行處理器、CPU、內存、存儲等資源,通過高速互聯總線形成全對等互聯架構,實現共享內存池;資源可根據不同的任務需求,像搭積木一樣進行靈活調配組合,實現了“一切皆對等、一切皆可池化、一切皆可組合”,使數百、數千個AI處理器聯接起來,像一臺計算機一樣工作、學習、思考、推理。
稿件來源網址:https://www.cnstock.com/commonDetail/588556
關鍵詞: 華為 AI