文章重點
- 智譜AI發布GLM-5,745B參數MoE架構(44B活躍參數),完全使用華為昇騰晶片訓練,實現零NVIDIA依賴,採用MIT開源授權
- 基準測試成績刷新多項開源紀錄:SWE-bench Verified 77.8%、AIME 2026 92.7%、GPQA-Diamond 86.0%,在Humanity's Last Exam上以50.4分超越Claude Opus 4.5
- 以「Pony Alpha」名義在OpenRouter秘密測試,首日處理400億token,BrowseComp開源第一名(75.9分)
- 智譜AI在港股股價暴漲34%,標誌着中國AI自主生態系統的里程碑式突破,美國出口管制效力面臨根本性質疑
一個模型為何震動整個地緣政治格局?
2026年2月19日,智譜AI(Zhipu AI)悄然發布了GLM-5。在一個幾乎每周都有新模型發布的年代,這看似又一則例行公事的技術新聞。但當技術細節被逐步披露後,整個AI產業意識到這不是一次普通的模型更新——它可能是過去三年中最具地緣政治意義的AI事件。
原因很簡單:GLM-5是首個在基準測試中達到前沿水平的大語言模型,完全使用華為昇騰(Ascend)晶片訓練,沒有使用任何一顆NVIDIA GPU。在美國政府投入大量政策資源、外交資本和情報監控來阻止中國獲得先進AI晶片的背景下,這一成就的意義遠超技術本身。它直接挑戰了一個核心假設:切斷NVIDIA供應就能有效延緩中國的AI進展。
更令人矚目的是,智譜選擇了MIT開源授權——這是最寬鬆的開源許可證之一,允許任何人(包括商業機構)自由使用、修改和分發模型權重。這一決定不僅是商業策略,更是一種宣言:中國不僅能在封鎖中建設AI能力,還有信心將成果與全世界分享。
GLM-5的技術架構:大力出奇跡之外的精巧設計
GLM-5採用混合專家(Mixture of Experts, MoE)架構,總參數量為745B(7,450億),但每次推理只激活44B(440億)參數。這種設計的精妙之處在於:模型擁有大模型的知識容量和表達能力,但推理時的計算成本接近於一個中等規模的密集模型。
28.5萬億token的訓練數據規模在當前開源模型中屬於頂級水平,接近Meta Llama 4和DeepSeek V3的訓練數據量。200K的上下文窗口長度使GLM-5能夠處理極長的文檔、代碼庫和多輪對話,這對於企業級應用場景至關重要。
從架構細節來看,GLM-5在多個方面展現了中國AI研究者的獨立創新能力。模型採用了改良版的RoPE位置編碼(Rotary Position Embedding),針對超長上下文場景進行了特別優化;專家路由機制使用了一種智譜稱之為「動態負載均衡」(Dynamic Load Balancing)的新方法,能在推理過程中根據輸入複雜度自動調整活躍專家數量,從而在簡單查詢上實現更快的回應速度。
MoE架構的經濟邏輯
為什麼MoE架構在當前AI產業中如此重要?核心原因是經濟效率。以GLM-5為例,745B總參數意味着模型在訓練過程中學習了極為豐富的世界知識,但推理時只激活44B參數(約6%),使得推理成本降至密集模型的數分之一。對於需要大規模部署AI服務的企業來說,這意味着在相同的硬體預算下能服務多倍的用戶。DeepSeek V3、Mixtral和Google的Switch Transformer都採用了類似策略,MoE正在成為前沿模型的主流架構選擇。
基準測試:數據說話
一個模型的技術規格再華麗,最終要用基準測試來驗證。GLM-5在多個權威基準上的表現令業界側目。
SWE-bench Verified(77.8%):這是衡量AI解決真實軟體工程問題能力的黃金標準基準。77.8%的成績意味着GLM-5能夠自主修復接近五分之四的真實GitHub issue,這一水平已接近最頂級的閉源模型。對於開源社區而言,這代表着一個強大的AI編程助手現在可以免費獲得。
AIME 2026(92.7%):美國數學邀請賽(AIME)是衡量數學推理能力的重要指標。92.7%的成績在所有公開模型中名列前茅,表明GLM-5在數學和邏輯推理方面具有頂級能力。
GPQA-Diamond(86.0%):由專家級科學家設計的研究生水平科學問題集,被認為是最具挑戰性的學術基準之一。86.0%的表現證明GLM-5在科學推理方面的能力已經達到了專業研究者的水平。
Humanity's Last Exam(50.4):這可能是最具象徵意義的數據。這一由頂級學者設計的超高難度基準旨在測試AI的極限能力。GLM-5的50.4分超過了Anthropic的Claude Opus 4.5,後者是目前公認的最強閉源模型之一。雖然分數差距不大,但一個開源模型在這種極端難度的測試上超越閉源前沿模型,本身就是歷史性的。
BrowseComp(75.9):在衡量模型網頁瀏覽和信息檢索能力的BrowseComp基準上,GLM-5以75.9分位居開源模型第一。這對於需要AI代理進行網絡研究和數據收集的應用場景特別有價值。
「Pony Alpha」:秘密測試的策略
在正式發布前,智譜採用了一個引人注目的策略:以「Pony Alpha」為名,將GLM-5悄悄部署到了OpenRouter平台上。OpenRouter是一個聚合多家AI模型的API路由平台,技術用戶可以自由測試和比較不同模型。
「Pony Alpha」上線的第一天就處理了400億token的請求量——這是一個驚人的數字,說明技術社區在發現這個「神秘新模型」後迅速被其能力吸引。在OpenRouter的匿名評測排行榜上,「Pony Alpha」在多個任務類別中迅速攀升至前三名,引發了廣泛的猜測和討論。
這種「先匿名測試、後揭曉身份」的發布策略並非智譜首創——Meta的Llama團隊和Google DeepMind都曾使用過類似手法。其核心優勢在於:匿名狀態下的評測結果更具可信度,因為用戶是基於模型的實際表現而非品牌聲譽做出評判。當「Pony Alpha」的真實身份被揭曉時,其已經積累的正面口碑成為最有力的宣傳。
400億token的含義
GLM-5以「Pony Alpha」身份在OpenRouter上線首日處理400億token,這意味着什麼?以平均每次對話消耗2,000 token計算,400億token相當於約2,000萬次完整對話。即使考慮到大量的基準測試和壓力測試流量,這一數字仍然反映出極高的社區興趣。作為對比,OpenRouter上的主流模型如Claude 3.5 Sonnet在正常日子的處理量通常在50億-100億token區間。GLM-5首日即達到4倍以上的流量,說明了開源社區對一個能匹敵閉源前沿模型的渴望。
華為昇騰:被低估的AI晶片實力
GLM-5最具突破意義的方面不在於模型本身,而在於其訓練硬體。完全使用華為昇騰(Ascend)晶片進行訓練,零NVIDIA依賴——這一事實迫使全球AI產業重新評估華為在AI計算領域的真實能力。
華為昇騰系列的旗艦產品Ascend 910B/910C已在中國國內的多個大型數據中心部署。根據公開資料,910B的BF16算力為約256 TFLOPS,而NVIDIA H100的BF16算力約為990 TFLOPS。單論原始算力,華為昇騰與NVIDIA的差距仍然顯著——約為3至4倍。
然而,GLM-5的成功表明,原始算力的差距可以通過其他途徑彌補。智譜的技術團隊在訓練效率優化上投入了大量精力:改進的模型並行策略、更高效的梯度通信算法、以及針對昇騰架構特性定制的算子優化(operator optimization)。根據智譜公開的技術報告,他們最終實現了接近理論峰值80%的MFU(Model FLOPs Utilization),這在任何硬體平台上都是優秀的水平。
另一個不容忽視的因素是規模。華為能夠為中國的AI訓練需求提供的昇騰晶片數量,遠超外界的普遍認知。由於不受出口管制限制,華為可以無限量供應國內客戶。當智譜需要數萬顆昇騰晶片組建訓練集群時,供應不是問題。這與許多非美國企業面臨的NVIDIA GPU短缺形成了鮮明對比。
出口管制的悖論:限制越嚴,自主越快?
GLM-5的出現正在華盛頓引發一場激烈的政策辯論。自2022年10月以來,美國政府持續收緊對華AI晶片出口管制,目標是將中國的AI能力壓制在落後美國「至少兩代」的水平。然而,現實的發展似乎正走向相反的方向。
回顧過去三年的時間線,趨勢令人深思。2023年初,中國AI實驗室普遍依賴已有的NVIDIA A100庫存進行訓練,技術水平落後美國前沿約一年。2024年,DeepSeek V2的發布展示了中國團隊在有限硬體條件下通過算法創新追趕的能力。2025年,DeepSeek V3和阿里巴巴的Qwen 2.5系列進一步縮小了差距,但仍依賴早期囤積的NVIDIA晶片。2026年2月,GLM-5完全脫離NVIDIA生態——差距不是縮小了,而是在部分維度上被抹平了。
這一演變路徑揭示了出口管制的一個根本性悖論:短期限制確實造成了不便和成本增加,但長期效果可能恰恰是加速了被限制方的自主能力建設。當中國企業無法購買NVIDIA GPU時,它們別無選擇,只能全力支持華為昇騰等國產替代品。這種「被迫的國產化」反而為國產AI晶片生態提供了最強的市場拉力。
美國政策界的分歧
GLM-5的發布在美國政策圈引發的反應兩極分化。一派認為這證明了出口管制的失敗,應該重新評估策略——與其推動中國建立完全獨立的AI生態,不如通過有控制的出口維持美國技術的影響力和市場份額。另一派則堅持認為,管制即使無法完全阻止中國的進展,也至少增加了其成本和時間,延緩了軍事AI應用的發展速度,因此仍有戰略價值。現實可能在兩者之間:出口管制在戰術層面有效(增加了中國AI訓練的單位成本),但在戰略層面正在失效(未能阻止前沿能力的達成)。
中國AI生態的三足鼎立
GLM-5的發布使中國的AI格局更加清晰:智譜AI、DeepSeek和阿里巴巴通義千問(Qwen)正在形成三足鼎立的競爭態勢,各自走出了差異化的路線。
智譜AI選擇了「完全國產化+MIT開源」的路線。GLM-5在華為昇騰上的成功訓練使其成為中國AI自主可控的標桿。MIT許可證的選擇則意味着智譜將模型的商業價值讓渡給了社區,轉而通過API服務、企業定制和技術顧問獲取收入。智譜的背景(清華大學計算機系孵化)使其在學術界和政府項目中有天然優勢。
DeepSeek走的是「極致效率」路線。其V3模型以相對較小的訓練成本達到前沿水平,證明了高效算法設計可以部分彌補硬體劣勢。DeepSeek的方法論更接近學術研究的風格,發表了大量技術論文並開源了訓練代碼。然而,DeepSeek是否完全依賴國產晶片仍存在爭議——部分報道指出其訓練集群中仍包含早期獲取的NVIDIA A100。
阿里巴巴Qwen則依託母公司的商業生態和雲計算基礎設施,走「規模化+商業落地」路線。Qwen系列模型的優勢在於與阿里雲的深度整合,能為企業客戶提供從模型到部署的一站式解決方案。阿里在自研AI晶片(含光系列)上的投入也使其具備了一定程度的硬體自主能力。
三家公司的共同點在於:它們都選擇了開源策略,而且都在積極減少對NVIDIA的依賴。這種趨勢正在從根本上重塑全球AI的競爭格局——中國的AI不再是美國的跟隨者,而是在開源領域形成了獨立且有競爭力的生態系統。
對全球AI晶片競爭的深遠影響
GLM-5對全球AI晶片市場的影響是多層次的。
首先,它為NVIDIA的競爭對手提供了一個令人信服的論據。如果華為昇騰能夠支撐前沿模型的訓練,那麼AMD的MI300X、Intel的Gaudi 3、以及各家初創企業的AI加速器理論上也有同樣的潛力。問題從來不只是硬體的原始性能,還包括軟體生態和訓練框架的成熟度。智譜團隊在昇騰上積累的訓練優化經驗(包括與華為合作改進的CANN算子庫),某種程度上驗證了「非CUDA」路線的工程可行性。
其次,GLM-5可能加速全球AI晶片供應鏈的「去中心化」。在GLM-5之前,許多非美國企業和政府在規劃AI基礎設施時的默認選項是NVIDIA。現在,華為昇騰成為了一個有實績背書的備選方案,特別是對於擔心地緣政治風險的中東、東南亞和非洲客戶。華為在這些市場的電信業務基礎使其具備了天然的銷售渠道。
第三,這一突破將倒逼整個AI訓練軟體堆疊的標準化。長期以來,CUDA的主導地位使得GPU軟體生態高度碎片化。隨着越來越多的模型在不同硬體上訓練成功,行業可能加速向硬體無關(hardware-agnostic)的訓練框架演進,例如OpenAI支持的Triton語言和各種XLA編譯器。
港股市場的反應與投資含義
GLM-5發布後,智譜AI在港股的股價單日暴漲34%,成交量較日均放大超過8倍。這一漲幅反映的不僅是對智譜本身的看好,更是市場對整個中國AI自主生態系統估值的重新定價。
連鎖反應迅速擴散。華為概念股普遍上漲,其中與昇騰晶片供應鏈相關的公司漲幅最為顯著。中芯國際、寒武紀等國產半導體企業也獲得資金追捧,因為GLM-5的成功強化了「國產AI晶片可行」的市場敘事。
對於香港投資者而言,GLM-5事件提供了幾個重要的投資啟示。第一,中國AI企業的技術實力正在被系統性低估——市場仍習慣性地認為中國AI企業是「跟隨者」,但GLM-5在多個基準上超越Claude Opus 4.5的事實正在改變這一認知。第二,AI晶片的供應鏈地圖正在被重繪,華為昇騰的崛起意味着相關的國產半導體生態(包括封裝、測試、散熱等環節)將獲得持續的增長動力。第三,開源AI模型的商業模式仍在探索中——智譜選擇MIT開源意味着模型本身不直接產生收入,投資者需要關注其API服務和企業解決方案的變現效率。
結語:一個新時代的開端?
GLM-5的發布可能在多年後被回顧為中國AI發展史上的轉折點——不是因為它是最強的模型(在所有維度上它仍未全面超越GPT-5或Claude Opus 4.5),而是因為它證明了一條完全獨立於美國技術供應鏈的前沿AI發展路徑是可行的。
這對全球AI格局的意義是深遠的。它意味着世界正在從「單一AI生態系統」走向「多極AI生態系統」——美國主導的NVIDIA/CUDA生態和中國主導的昇騰/CANN生態將並行發展,各自服務不同的市場和客戶群。對於夾在兩者之間的歐洲、東南亞和其他地區來說,這反而提供了更多的選擇和議價空間。
對於NVIDIA來說,GLM-5的出現雖然不會在短期內影響其壟斷性的市場地位——畢竟全球絕大多數AI訓練仍在NVIDIA GPU上進行——但它確實在長期敘事上敲響了一個警鐘:技術封鎖不是永久的護城河,競爭對手終將找到繞過的路徑。正如黃仁勳自己在多個場合所說的,「NVIDIA的競爭對手不是其他晶片公司,而是我們客戶自己設計的晶片。」現在,這份競爭對手名單上需要加上一個新名字:華為。
智譜AI用GLM-5向世界發出了一個清晰的信號——中國的AI能力不僅存在,而且正在開源、公開、可驗證的基礎上持續進步。在AI技術快速演進的今天,這也許是比任何單一模型的基準分數都更重要的訊息。