Copyright 2017-2025 北方報 版權所有 京ICP備16071829-1號
芯片問題其實沒必要擔心,用疊加和集群等方法,計算結果上與最先進水平是相當的。”近期,華為總裁任正非的一次公開發聲,增強了社會各界對中國AI發展的信心。
我們都知道,中國已經形成了“百模千態”的大模型產業,有多個大模型走在全球前列。但無論AI產業如何發展,算力都是驅動模型演進的根本動力。隨著外部技術封鎖步步緊逼,國產算力能否擔當大用?是否只能做推理而不能做復雜訓練?很多人其實心里沒底。
“我們單芯片還是落后美國一代,我們用數學補物理,非摩爾補摩爾,用群計算補單芯片,在結果上也能達到實用狀況。”任正非的公開發聲,給國內AI產業吃下了一顆“定心丸”。
帶著對國產算力發展的關心,觀察者網與華為2012實驗室的技術專家的做了一次交流,我們了解到,昇騰算力不僅實現推理性能全球領先,同時系統穩定性也保持在高水平,能高效訓出世界一流的萬億參數大模型。尤其是CloudMatrix 384超節點技術,以系統補單點,從堆芯片到拼架構,核心指標比肩英偉達,成為中國AI發展的堅實算力底座。
芯片問題為何不用擔心?
在外部制裁圍堵下,芯片問題就像“達摩克里斯之劍”一樣,一直懸在中國產業界頭上。尤其隨著中美AI競爭愈發激烈,美國一方面竭力遏制中國先進芯片制造的能力,另一方面又不斷收緊對英偉達高端芯片的出口管制,試圖讓中國AI產業在“算力囚籠”中止步不前。
但危中也有機。行業的發展趨勢是,當Transformer這樣的大型神經網絡模型橫空出世,萬億參數模型開始涌現,對算力和顯存的需求呈爆炸式增長,單個GPU甚至單個服務器都難以招架,集群算力成為大勢所趨,這也給中國用系統方法解決算力困境帶來契機。
說起“系統論”,老一輩中國人可能并不陌生。錢學森的《論系統工程》,核心思想就是把研究對象看做一個整體而不是孤立的點,通過整體優化彌補單點落后。
華為制裁中突圍,正是受到系統工程的啟發。技術專家對觀察者網表示,算力基礎設施是復雜的系統,華為把各個部分打通了,在內部組織了算力會戰,把華為云、模型、底座、芯片、硬件工程、基礎軟件的研發力量集結在一起,跨部門作戰,深度協同。這樣的環境和機制,能夠產生協同效應和系統工程的整合,實現了“大雜燴”技術的有效利用和協同創新。
基于系統工程,華為構建了巨型算力基礎設施CloudMatrix 384超節點,通過全對等高速互聯架構,讓384張昇騰卡可以像一臺計算機一樣工作。它的算力總規模達300Pflops,是英偉達旗艦NVL72的1.7倍;網絡互聯總帶寬達269TB/s,比英偉達NVL72提升107%;內存總帶寬達1229TB/s,比英偉達NVL72提升113%。更關鍵的是,它還能擴展為包含數萬卡的Atlas 900 SuperCluster超節點集群,未來可以支撐更大規模的模型演進。