文章重點
- 智譜AI於2月11日發佈GLM-5模型:總參數744B,活躍參數44B,採用256專家的MoE(混合專家)架構,每個token激活8位專家,實現效率與性能的極致平衡
- GLM-5完全基於10萬片華為昇騰910B晶片訓練,未使用任何NVIDIA硬件——這是全球首個完全脫離美國AI晶片的前沿模型
- SWE-bench得分77.8%,超越Gemini 3 Pro(76.2%)和GPT-5.2(75.4%),僅次於Claude Opus 4.5(80.9%);Humanity's Last Exam得分50.4%超越Claude Opus 4.5,業界最低幻覺率
- 以MIT許可證在HuggingFace開源,成為全球排名第一的開源模型;定價每百萬輸入tokens僅1.00美元,較Claude Opus 4.6便宜5至8倍
- 智譜AI於1月8日在港交所IPO,募資43.5億港元(5.58億美元);GLM-5發佈後股價飆升34%,成為香港科技IPO的標誌性事件
一、十萬片昇騰晶片的宣言:不是替代方案,而是平行宇宙
2026年2月11日,智譜AI正式發佈GLM-5。單從技術參數看——744B總參數、44B活躍參數、256位專家的MoE架構——這是一個令人印象深刻但並非史無前例的大語言模型。然而,真正讓GLM-5成為行業地震事件的,不是它的參數量,而是它的訓練基礎設施:10萬片華為昇騰910B晶片,零NVIDIA硬件。
這句話的分量需要放在過去三年的半導體博弈中才能充分理解。自2022年10月美國商務部首次對中國實施先進AI晶片出口管制以來,整個行業的共識是:中國AI公司可以在推理層面找到替代方案,但在訓練前沿模型所需的大規模算力方面,與NVIDIA的差距至少有2-3代。華為昇騰910B在理論算力指標上大約相當於NVIDIA A100的水平,與H100、H200乃至最新的Blackwell架構存在顯著代差。
然而,GLM-5的基準測試結果直接挑戰了這一敘事。如果一個在「落後」硬件上訓練的模型能夠在SWE-bench上擊敗使用最先進NVIDIA晶片訓練的GPT-5.2和Gemini 3 Pro,那麼「硬件決定論」的邏輯就需要被重新審視。這並不意味着華為晶片已經追上了NVIDIA——在單卡性能、互聯頻寬、軟件生態等方面差距依然存在——但它證明了一個更加微妙的命題:在足夠的工程優化和算法創新下,硬件的代差是可以被部分彌補的。
智譜選擇用10萬片昇騰910B而非更少數量的更高性能晶片來完成訓練,本身就是一種工程哲學的選擇。這意味着他們在分佈式訓練、通訊效率、故障容錯等方面積累了大量非公開的know-how。這些工程能力可能比模型本身更具戰略價值——因為它們為整個中國AI產業提供了一條經過驗證的「去NVIDIA化」路徑。
二、MoE架構的精妙設計:256位專家的效率革命
GLM-5採用的MoE(Mixture of Experts)架構是其技術設計中最值得深入分析的部分。744B的總參數分佈在256位「專家」之中,但每個token的推理過程只激活其中8位專家,對應44B的活躍參數。這意味着GLM-5在推理時的計算成本僅相當於一個44B參數的密集模型,卻能夠從744B參數的知識容量中獲益。
這種設計的深層意涵在於成本結構。AI模型的運營成本主要由推理時的計算量決定,而非訓練時的總參數量。GLM-5的44B活躍參數使其推理成本遠低於同等知識容量的密集模型——這直接反映在其定價上:每百萬輸入tokens僅1.00美元,每百萬輸出tokens 3.20美元,相比Claude Opus 4.6便宜5至8倍。
256位專家的數量選擇也頗具匠心。此前的MoE模型(如Mixtral的8位專家、DeepSeek-V3的256位專家)已經證明,更多的專家數量能夠實現更細粒度的知識分工,讓每位專家在其擅長的領域達到更高的精度。GLM-5選擇與DeepSeek-V3相同的256專家配置,但活躍專家數從DeepSeek的8位維持不變,同時將總參數量從671B提升至744B——這是在DeepSeek架構基礎上的漸進式改良而非根本性變革。
對於技術決策者而言,GLM-5的MoE設計傳遞的信號是:前沿模型的競爭正在從「誰的參數多」轉向「誰的效率高」。當一個44B活躍參數的模型能夠在主要基準測試中擊敗數倍於其活躍規模的密集模型時,效率優化的價值已經超越了單純的規模擴張。這一趨勢對推理側的硬件需求、API定價結構乃至整個AI行業的商業模式都將產生深遠影響。
三、基準測試的拆解:強項驚人,短板明確
GLM-5的基準測試成績呈現一幅複雜但清晰的圖景,既有令人矚目的突破,也有坦誠的不足。
最引人注目的是SWE-bench上的77.8%得分。SWE-bench測試的是模型解決真實軟件工程問題的能力——理解代碼庫、定位bug、編寫修復方案。GLM-5在這項基準上超越了Google的Gemini 3 Pro(76.2%)和OpenAI的GPT-5.2(75.4%),僅次於Anthropic的Claude Opus 4.5(80.9%)。考慮到這是一個完全基於國產硬件訓練的模型,這一成績的象徵意義甚至超過了其技術意義。
同樣令人驚訝的是Humanity's Last Exam(HLE)上的50.4%得分。HLE被設計為「人類最後的考試」,包含各學科最頂尖專家認為AI難以解決的問題。GLM-5在這項測試中超越了Claude Opus 4.5——目前公認的最強通用模型之一。更為突出的是,智譜聲稱GLM-5擁有「業界最低幻覺率」,這意味着它在事實準確性方面的表現優於所有競爭對手。
但成績單並非全線領先。在Claude Opus 4.5佔據絕對優勢的某些推理任務上,GLM-5的3.1個百分點差距(SWE-bench上80.9%對77.8%)說明頂尖閉源模型在工程能力上仍有明顯優勢。此外,200K的上下文窗口雖然足夠應對大多數場景,但在超長文檔處理方面落後於某些支持百萬級token上下文的競爭者。
對於模型評估的專業觀察者而言,GLM-5最值得關注的是其強項的分佈模式:代碼能力和事實準確性出眾,而非單純追求通用基準測試的分數。這暗示智譜在訓練策略上可能做出了有意識的取捨——優先優化在實際應用中價值最高的能力維度,而非追求所有基準測試的全面碾壓。這是一種成熟的工程判斷,而非資源不足的妥協。
「GLM-5的意義不在於它在哪些基準上排名第一,而在於它在什麼硬件條件下取得了這些成績。它證明了前沿AI不是美國晶片的專屬領域。」
四、MIT開源的戰略博弈:為何把最好的武器免費送出?
智譜選擇以MIT許可證在HuggingFace上開源GLM-5的全部權重,這在商業邏輯上看似矛盾:花費巨額資源訓練的前沿模型,為何免費開放給所有人(包括競爭對手)?要理解這一決策,必須超越傳統的軟件商業邏輯,從地緣科技和生態構建的維度來思考。
首先,開源是智譜最強有力的市場聲明。在中國AI公司長期被「山寨」、「抄襲」等偏見困擾的背景下,將一個能夠擊敗GPT-5.2和Gemini 3 Pro的模型完全開源,是對技術實力最不可辯駁的證明。開源意味着任何人都可以審查模型的每一個細節,這種透明度本身就是一種競爭力的展示。
其次,開源加速了國產AI硬件生態的成熟。GLM-5不僅支持華為昇騰晶片,還兼容摩爾線程、寒武紀、崑崙芯、MetaX、燧原科技、海光等國產AI晶片。通過開源,這些晶片廠商可以使用GLM-5作為基準來優化自身的軟件棧,而全球的開發者則可以在各種硬件平台上測試和部署GLM-5。這創造了一個良性循環:更多的開發者使用國產晶片運行GLM-5,推動國產晶片軟件生態的完善,進而吸引更多的開發者和企業用戶。
第三,開源構建了一道抵禦制裁風險的護城河。自2025年1月智譜被列入美國實體清單以來,其面臨的最大風險不是硬件供應(已經轉向國產),而是被排除在全球AI開發者社區之外。通過開源GLM-5,智譜確保了自己在全球開源社區中的核心地位——即使在地緣政治壓力下,全球開發者仍然有強烈的動機來使用和貢獻這個模型。
最後,API服務仍然是智譜的核心盈利模式。開源模型的權重是免費的,但企業級的推理服務、技術支持、定制化部署和SLA保障——這些才是智譜的收入來源。Meta的LLaMA系列已經證明了「開源模型+商業API服務」的商業模式是可行的。智譜的定價策略——每百萬輸入tokens 1.00美元——明確瞄準了那些希望降低AI成本的企業用戶,以價格優勢從OpenAI和Anthropic手中爭奪市場份額。
GLM-5技術規格一覽
架構:MoE(混合專家),256位專家,每token激活8位
總參數:744B(7,440億)
活躍參數:44B(440億)
訓練硬件:100,000片華為昇騰910B(零NVIDIA)
上下文窗口:200K tokens
授權協議:MIT開源許可證
API定價:$1.00/百萬輸入tokens,$3.20/百萬輸出tokens
兼容硬件:華為昇騰、摩爾線程、寒武紀、崑崙芯、MetaX、燧原科技、海光
發佈平台:HuggingFace
五、港股IPO的驚人軌跡:從5.58億美元募資到34%股價飆升
智譜AI的資本市場故事,是理解GLM-5戰略意義的另一個關鍵維度。2026年1月8日,智譜在港交所主板上市,募資43.5億港元(約5.58億美元)。這是繼商湯科技之後,又一家中國AI領域的重量級IPO選擇了香港作為上市地。
選擇香港而非A股或美股上市,本身就是一個精心計算的戰略決策。A股的審批流程漫長,且對未盈利科技公司的上市條件更為嚴格。美股在當前地緣政治環境下風險過高——一家被列入美國實體清單的中國AI公司在紐約上市,面臨的監管和政治風險不言而喻。香港作為連接中國與國際資本的橋樑,提供了最佳的平衡:既能接觸到全球機構投資者的流動性,又避免了美國市場的政治風險。
GLM-5在2月11日的發佈,距IPO僅一個月。此後智譜股價飆升34%,市值大幅擴張。這一表現背後有多重驅動因素:GLM-5本身的技術突破、中國AI概念股的整體熱度、以及港股市場對科技成長股的重新定價。但最根本的原因,是GLM-5用實打實的基準測試成績,為智譜的「技術故事」提供了最有說服力的背書。
對於香港資本市場而言,智譜IPO的成功具有示範效應。它證明了港交所有能力吸引和承載頂級AI公司的上市需求,也為後續的中國AI公司IPO潮鋪平了道路。香港交易所近年來不斷優化上市規則(包括18C章針對特專科技公司的規定),智譜的案例是這些改革成效的最佳佐證。
然而,34%的漲幅也帶來了估值泡沫的擔憂。AI公司的估值在很大程度上建立在未來增長預期之上,而非當前盈利能力。智譜的商業化進展——特別是GLM-5 API的企業客戶轉化率和收入增速——將在未來數個季度成為市場最關注的指標。如果技術突破無法轉化為可持續的收入增長,估值回調的風險不容忽視。
六、「春節攻勢」與中國AI的集體突圍
GLM-5並非孤立事件。它是2026年農曆新年前後中國AI實驗室集體發力的一部分——業界稱之為「春節攻勢」。在短短數週內,多家中國AI公司密集發佈了新一代模型和產品,形成了一波令全球市場措手不及的技術浪潮。
這種集體爆發的背後是多重因素的匯聚。首先,2025年的DeepSeek-V3和R1已經向全球證明了中國AI的工程能力,為後續的突破奠定了信心基礎。其次,美國持續加碼的晶片禁令(智譜等多家公司在2025年1月被列入實體清單,被禁止購買H100/H200等高端晶片)反而加速了中國AI產業的「去美國化」進程——當外部供應被切斷,內部創新的壓力和動力同時達到了頂峰。
「春節攻勢」對全球科技市場的衝擊是巨大的。當投資者意識到中國AI公司不僅沒有因為晶片禁令而衰退,反而在效率和開源方面取得了突破性進展時,一個根本性的疑問浮現了:美國科技巨頭每年數千億美元的AI基礎設施投資,是否存在嚴重的過度投資?
這個疑問直接引發了美國科技股的劇烈調整。在「春節攻勢」期間,美國科技股合計蒸發了約9,000億美元的市值。NVIDIA、Microsoft、Google、Amazon等AI基礎設施投資的主要受益者首當其衝——投資者開始質疑:如果中國公司能夠用華為晶片和更高效的算法達到相近的效果,那麼以NVIDIA H100/H200為核心的高溢價算力投資是否具有合理的回報預期?
這9,000億美元的市值蒸發不應被簡單解讀為「中國AI贏了,美國AI輸了」。更準確的理解是:市場正在重新定價AI發展的成本曲線。如果前沿AI不再需要最昂貴的硬件,那麼整個AI產業鏈的價值分配將發生根本性的變化——算力提供者的溢價被壓縮,算法和應用層的價值被提升。這對香港的AI投資者而言,是重新評估投資邏輯的重要契機。
「封鎖是最好的催化劑。當你無法購買最先進的晶片時,你被迫去發明更聰明的訓練方法。GLM-5是壓力下創新的產物,而非妥協的結果。」
七、晶片封鎖的悖論:制裁如何加速了中國AI的自主可控
美國對中國AI晶片的出口管制始於2022年10月,並在隨後的三年中不斷升級。2025年1月,智譜AI被正式列入美國實體清單,意味着它被完全禁止購買NVIDIA的H100、H200以及更先進的Blackwell系列晶片。從華盛頓的角度來看,這些制裁旨在遏制中國AI的發展速度,維持美國在AI領域的技術領先優勢。
GLM-5的出現,讓這一制裁邏輯面臨尷尬的質疑。一個完全脫離美國硬件的中國模型,在主要基準測試中擊敗了使用最先進美國硬件訓練的模型——這至少說明,晶片封鎖在阻止中國AI發展方面的效果,遠沒有預期中那麼顯著。
更為諷刺的是,制裁可能反而加速了中國AI產業生態的成熟。在沒有制裁的平行宇宙中,中國AI公司很可能繼續依賴NVIDIA晶片——畢竟這是成本最低、風險最小的選擇。但制裁切斷了這條捷徑,迫使整個產業鏈從晶片設計、製造到軟件棧進行全面的自主可控建設。GLM-5對華為昇騰、摩爾線程、寒武紀、崑崙芯、MetaX、燧原科技、海光七家國產晶片的全面兼容,正是這種產業生態成熟的直接體現。
這不意味着制裁對中國AI完全無效。在絕對性能方面,華為昇騰910B與NVIDIA H200或Blackwell之間仍然存在顯著差距。中國AI公司需要投入更多的晶片數量和更精巧的工程優化來彌補這一差距,這意味着更高的前期投資和更長的開發週期。但關鍵問題是:這些額外成本是否足以阻止中國AI達到前沿水平?GLM-5的答案是:至少在當前階段,不能。
對於美國政策制定者而言,這提出了一個根本性的戰略困境。繼續加碼晶片封鎖,可能進一步加速中國AI的自主化進程,同時削弱NVIDIA等美國晶片公司在中國市場的收入。放鬆制裁,則可能被視為對中國AI發展的默認讓步。無論選擇哪條路徑,晶片封鎖作為「延緩中國AI發展」的核心策略,其有效性都需要被重新評估。
GLM-5基準測試成績對比
SWE-bench(軟件工程):
Claude Opus 4.5:80.9% | GLM-5:77.8% | Gemini 3 Pro:76.2% | GPT-5.2:75.4%
Humanity's Last Exam(HLE):
GLM-5:50.4%(超越Claude Opus 4.5)
幻覺率:業界最低
開源排名:全球開源模型第一
訓練硬件:100,000片華為昇騰910B(唯一完全脫離NVIDIA的前沿模型)
八、定價策略的顛覆:1美元的衝擊波
GLM-5的API定價——每百萬輸入tokens 1.00美元、每百萬輸出tokens 3.20美元——在AI模型的商業競爭中投下了一枚重磅炸彈。作為對比,Claude Opus 4.6的定價約為GLM-5的5至8倍。當一個在基準測試中與頂級閉源模型接近的開源模型,以如此激進的價格進入市場時,整個AI API市場的定價基準都面臨下行壓力。
這種價格差異的根源是多方面的。MoE架構的44B活躍參數使推理成本天然低於大型密集模型。華為昇騰晶片的使用成本低於NVIDIA的旗艦產品(部分原因是中國的電力和運維成本較低,部分原因是昇騰晶片本身的定價策略)。此外,智譜作為一家中國AI公司,其人力成本和運營成本結構也有別於矽谷競爭對手。
但定價策略的核心邏輯不是「因為成本低所以定價低」,而是一種市場滲透戰略。智譜深知GLM-5的品牌知名度和市場信任度遠不及Claude、GPT或Gemini。在這種情況下,價格成為最直接的差異化武器。對於成本敏感的中小企業、初創公司和新興市場的開發者而言,GLM-5提供了一個極具吸引力的選擇:性能接近頂級模型,但成本僅為其零頭。
這一策略的長期影響可能比短期的收入犧牲更為深遠。如果GLM-5能夠憑藉價格優勢建立起龐大的開發者社區和企業用戶基礎,那麼智譜將擁有一個持續的收入引擎——即使單位收入較低,但巨大的使用量可以彌補。Meta的LLaMA系列已經證明,開源模型的社區效應可以轉化為間接的商業價值。智譜的「開源+低價API」雙管齊下,是對這一模式的更激進版本。
對於OpenAI、Anthropic和Google而言,GLM-5的定價策略帶來了一個兩難的選擇:跟進降價意味着利潤空間的大幅壓縮;維持高價則面臨用戶向更具性價比的替代方案遷移的風險。這種定價壓力,疊加DeepSeek等其他中國開源模型的競爭,正在系統性地壓縮AI模型API市場的毛利率——這可能是GLM-5對全球AI產業格局最深遠的影響之一。
九、香港視角:科技樞紐的歷史性機遇
GLM-5的發佈和智譜的港股IPO,為香港科技生態帶來了多重啟示。
首先,智譜IPO的成功進一步鞏固了香港作為中國AI企業首選上市地的地位。在中美科技脫鈎加速的背景下,中國頂級AI公司赴美上市的路徑已經基本被封堵。A股的審批機制對快速融資的需求回應不足。香港憑藉其國際化的資本市場、成熟的監管體系和連接中國與全球的獨特定位,正在成為中國AI資本化的核心節點。智譜的43.5億港元募資和後續34%的股價表現,為這一趨勢提供了最新的成功案例。
其次,GLM-5的國產硬件路線對香港的科技供應鏈佈局具有參考價值。香港科學園和數碼港正在大力發展AI基礎設施,但在算力部署方面面臨一個微妙的選擇:依賴NVIDIA還是擁抱國產替代?GLM-5證明了華為昇騰等國產晶片在前沿模型訓練和推理方面的可行性,這為香港的AI基礎設施規劃提供了更多的選項空間。在地緣政治風險持續升級的環境下,供應鏈的多元化不再是可選項,而是必選項。
第三,GLM-5的開源策略為香港的AI初創公司和研究機構創造了直接的發展機遇。此前,香港的AI開發者在使用前沿模型時主要依賴OpenAI和Anthropic的API服務——成本高昂且受制於海外供應商的定價策略和服務條款。GLM-5的MIT開源授權意味着任何香港機構都可以免費獲取模型權重,在本地部署和定制化使用。這對於香港的大學研究團隊、金融科技初創公司和數據敏感型企業而言,是一個重大的成本降低和自主性提升。
更宏觀地看,中國AI的集體崛起正在重塑香港的科技定位。香港不再只是中國科技公司的融資平台,也正在成為中國AI技術連接全球市場的橋頭堡。如果香港能夠抓住這一窗口,建立起完善的AI研發、部署和商業化生態,其在全球AI版圖中的角色將遠超「金融中心」的傳統定義。
十、全球AI競爭的新格局:從雙雄對峙到多極博弈
GLM-5的出現,標誌着全球AI競爭格局的一個結構性轉變:從「美國領先、中國追趕」的線性敘事,轉向一個更加複雜的多極博弈。
在閉源前沿模型層面,Anthropic的Claude Opus 4.5和OpenAI的GPT-5.2仍然佔據性能制高點,但領先幅度正在快速縮小。在開源模型層面,GLM-5已經登頂全球第一,與Meta的LLaMA系列、DeepSeek等形成了一個強大的開源競爭集團。在硬件和基礎設施層面,NVIDIA的統治地位正在被華為昇騰等替代方案侵蝕——不是在絕對性能上,而是在「足夠好」的實用性上。
這種多極化的競爭格局對整個產業的影響是深遠的。首先,它壓縮了AI模型的定價空間。當全球開源第一的模型以每百萬tokens 1美元的價格提供服務時,閉源模型的高溢價定價策略面臨越來越大的壓力。其次,它加速了AI的民主化。GLM-5的開源和低價使得更多的開發者和企業能夠接入前沿AI能力,降低了AI應用的門檻。第三,它改變了地緣政治博弈的計算邏輯——如果晶片封鎖無法有效延緩中國AI的發展,那麼制裁策略本身需要被根本性地重新評估。
對於投資者和企業決策者而言,GLM-5傳遞的核心信息是:AI行業正在從「誰的模型最強」的單一維度競爭,轉向「性能、成本、開放性、硬件多元化」的多維度競爭。在這個新格局中,最終的贏家不一定是基準測試分數最高的模型,而可能是那個在性能、價格和可用性之間找到最佳平衡點的模型——而GLM-5,正在這個平衡點上展現出強大的競爭力。
「美國科技股9,000億美元市值的蒸發不是恐慌性拋售,而是市場對AI成本曲線的一次理性重定價。當中國用十分之一的硬件成本達到相近的性能水平時,所有人都必須重新計算AI投資的回報率。」
GLM-5的故事還遠沒有結束。它的長期影響取決於多個尚未明確的變量:商業化進展能否支撐港股估值?國產晶片生態能否持續跟進下一代模型的需求?開源社區能否圍繞GLM-5形成自我強化的創新飛輪?但無論這些問題的答案如何,GLM-5已經完成了它最重要的歷史使命:證明在AI的前沿競賽中,沒有任何單一國家或任何單一晶片供應商可以壟斷創新的可能性。而對於香港——這座正在重新定義自身科技角色的城市——而言,這或許是最值得關注的信號。