MiniMax M2.5震撼發佈:中國開源模型叫板西方前沿AI,成本僅三十三分之一

文章重點

  • 中國AI初創公司MiniMax正式發佈M2.5,一款擁有2300億參數的開源大型語言模型,採用MIT授權協議,任何人均可自由使用、修改和商用,標誌着中國開源AI生態的又一次重大突破
  • M2.5採用混合專家(Mixture-of-Experts)架構,雖然總參數量達2300億,但每次推理僅激活約100億參數,大幅降低了運算成本和部署門檻,使其在消費級硬件上亦具可行性
  • 在業界權威的SWE-Bench Verified基準測試中,M2.5取得80.2%的得分,MiniMax聲稱該模型在網頁搜索及辦公場景任務上已超越Claude Opus 4.6、GPT-5.2和Gemini 3 Pro等西方前沿模型
  • M2.5的API定價為每百萬輸入token僅$0.15美元,相比Claude Opus 4.6的$5.00,成本僅為三十三分之一;其高速變體M2.5-Lightning更可達到每秒100個token的推理速度,進一步壓縮使用成本
  • 消息公佈後MiniMax股價急升15.7%,反映市場對中國AI公司在性價比賽道上挑戰西方巨頭的高度期待;對香港企業而言,同時接入中西方AI模型的獨特地理優勢正日益成為重要的競爭籌碼

一、M2.5橫空出世:一個新名字攪動AI格局

2026年3月初,中國AI初創企業MiniMax正式對外發佈其最新旗艦模型M2.5,迅即在全球AI行業引發廣泛關注。MiniMax這家總部位於上海的公司,雖然在公眾知名度上不及DeepSeek或阿里巴巴旗下的通義千問(Qwen),但在業內早已憑藉其在長上下文處理和多模態能力方面的技術積累而建立了穩固的聲譽。此次M2.5的發佈,標誌着MiniMax從「技術實力被低估的二線選手」正式躍升為全球AI競賽中不可忽視的重量級參與者。

M2.5的核心參數令人矚目:總參數量達到2300億(230B),採用混合專家(Mixture-of-Experts, MoE)架構,在實際推理過程中每次僅激活約100億(10B)參數。這種設計哲學的核心邏輯是——並非所有任務都需要動用模型的全部能力,通過智能路由機制將每個輸入分配給最相關的「專家」子網絡處理,可以在保持輸出質量的同時大幅降低計算開銷。MoE並非MiniMax的首創——Google的Switch Transformer和Mistral的Mixtral都是這一架構的先行者——但M2.5將這一技術路線推進到了前所未有的性價比高度。

更具戰略意義的是M2.5的授權模式。MiniMax選擇以MIT許可證——開源世界中最寬鬆的授權協議之一——發佈模型的全部權重。這意味着全球任何個人、企業或機構都可以自由下載、使用、修改甚至將M2.5整合至商業產品中,而無需向MiniMax支付任何費用或獲取額外授權。在Meta的Llama系列仍附帶使用限制、Google的Gemma在商用場景下存在條件約束的背景下,MiniMax的MIT授權策略堪稱當前主流大模型中最為徹底的開源實踐。

二、技術剖析:MoE架構如何以小博大

要理解M2.5何以能夠在成本上實現對西方前沿模型的數量級優勢,必須深入了解其混合專家架構的技術原理。傳統的密集型(dense)大型語言模型——如早期的GPT系列和Claude系列——在處理每一個token時都會激活模型的全部參數。這意味着,無論用戶提出的是一個簡單的翻譯請求還是一個複雜的多步推理問題,模型消耗的計算資源基本相同。這種「全員出動」的方式在性能上確有保障,但在效率上存在巨大的浪費。

MoE架構的核心思路是將模型拆分為多個專門化的「專家」子網絡,並引入一個「路由器」(router)模塊來決定每個輸入應該由哪些專家處理。在M2.5的設計中,2300億的總參數分佈在數十個專家模塊中,但路由器在每次推理時只會選擇激活其中一小部分——約100億參數——來處理當前的輸入。不同的專家可能專精於不同類型的任務:部分專家擅長數學推理,部分專家精通自然語言理解,部分專家在代碼生成方面表現突出。路由器學會了根據輸入的特性,將任務分配給最合適的專家組合。

這種架構帶來的直接好處是推理成本的大幅下降。由於每次推理僅需計算100億參數——而非全部2300億——M2.5的單次推理所需的浮點運算量(FLOPs)僅為同等總參數量密集模型的約二十分之一。這不僅直接降低了GPU的計算負載,還意味着模型可以在更少的GPU上運行,進一步壓縮了部署成本。對於資源有限的中小企業或初創公司而言,這一差距可能意味着「用得起」和「用不起」之間的分界線。M2.5-Lightning變體更是將推理速度推至每秒100個token,使其在即時對話和快速批量處理等場景中具備了與專用小模型相媲美的響應速度。

2300億
M2.5總參數量
100億
每次推理激活參數量
80.2%
SWE-Bench Verified得分
1/33
相比Claude Opus 4.6的成本比

三、基準測試表現:數據背後的真實實力

M2.5在業界最受關注的基準測試中交出了一份令人印象深刻的成績單。在SWE-Bench Verified——一個要求模型在真實開源項目中定位並修復軟件缺陷的高難度測試——中,M2.5取得了80.2%的通過率。這一數字的含義是:在經過人工驗證的真實軟件問題集合中,M2.5能夠正確解決超過八成的問題。SWE-Bench之所以被視為當前最具鑑別力的代碼能力基準之一,是因為它不僅測試模型生成代碼的能力,更考驗其理解複雜代碼庫結構、定位問題根源並產出可通過測試的修復方案的綜合能力。

MiniMax更進一步聲稱,M2.5在網頁搜索整合和辦公場景任務(如文檔摘要、數據分析、報告生成等)方面的表現已超越Claude Opus 4.6、GPT-5.2和Gemini 3 Pro——當今西方AI實驗室的三大旗艦模型。這一聲明需要謹慎解讀:AI模型的基準測試表現高度依賴於測試集的選擇、評估方法的設計以及測試條件的設定。MiniMax目前公佈的主要是內部評測數據,獨立第三方的全面對比測試尚在進行中。然而,即便最終的獨立評測顯示M2.5在某些維度上略遜於上述西方模型,其「以三十三分之一的價格達到相近水平」的價值主張仍然具有顛覆性的意義。

值得特別注意的是M2.5在中文處理能力上的表現。作為一款由中國團隊開發、以中文語料為核心訓練數據之一的模型,M2.5在中文理解、中文創作和中英文翻譯等任務上展現出明顯的本地化優勢。對於以中文為主要工作語言的香港企業而言,這種語言親和力可能比純粹的基準測試分數更具實際意義——在日常業務中,一個能夠精確理解粵語書面表達、熟悉香港法律及商業術語、並以地道繁體中文輸出的模型,其實用價值往往超過一個基準分數更高但中文能力相對薄弱的西方模型。

四、定價衝擊波:AI行業的「價格屠夫」時刻

如果說M2.5的技術參數令人印象深刻,那麼其定價策略則堪稱對整個AI行業商業模式的正面衝擊。MiniMax為M2.5 API設定的價格為每百萬輸入token $0.15美元。作為參照,Anthropic的Claude Opus 4.6——目前被廣泛認為是綜合能力最強的AI模型之一——的定價為每百萬輸入token $5.00美元。簡而言之,M2.5的輸入成本僅為Claude Opus 4.6的三十三分之一。即便與定價更為親民的GPT-5.2相比,M2.5仍然維持着顯著的價格優勢。

這種定價策略並非MiniMax的孤立行為,而是中國AI行業過去一年來愈演愈烈的「價格戰」的最新升級。自2025年初DeepSeek以極低的API定價打響價格戰第一槍以來,阿里巴巴的通義千問、百度的文心一言、位元組跳動的豆包等中國AI產品紛紛跟進降價,形成了一場持續至今的「殺價競賽」。在這場競賽中,MiniMax以其MoE架構帶來的天然成本優勢,將價格底線進一步壓低至此前難以想像的水平。

對西方AI實驗室而言,這一定價趨勢構成了深層次的商業模式挑戰。Anthropic、OpenAI和Google DeepMind在過去數年中投入了數以百億美元計的資金用於模型訓練和基礎設施建設,其API定價在相當程度上反映了這些巨額投入的攤銷需求。當一個以三十三分之一價格提供「足夠好」性能的替代方案出現時,這些公司面臨的不僅是市場份額的侵蝕,更是投資回報模型的根本性動搖。如果前沿模型的商業價值持續被低價替代品稀釋,那麼維持每年數十億美元研發投入的經濟邏輯將越來越難以成立。

「AI行業正在經歷一場前所未有的價格重定義。當中國公司以十分之一甚至三十分之一的價格提供性能相近的模型時,西方AI實驗室必須回答一個根本性問題:他們的護城河究竟是技術領先,還是僅僅是先發優勢帶來的定價權?而這個定價權,現在正在被快速侵蝕。」——一位香港風險投資機構AI領域合夥人

五、市場反應與行業版圖重繪

資本市場對M2.5的發佈做出了迅速而明確的反應。消息公佈當日,MiniMax的股價大幅上漲15.7%,市值增加數十億美元。這一漲幅不僅反映了投資者對M2.5產品本身的看好,更折射出市場對中國AI公司在全球競爭格局中持續上升勢頭的認可。與此同時,部分西方AI概念股在同日出現了小幅回調,顯示投資者正在重新評估中西方AI公司之間的相對價值。

MiniMax的崛起並非孤立事件,而是中國AI產業過去兩年間集體爆發的一個縮影。DeepSeek在2025年初以其開源的R1推理模型一鳴驚人,隨後又推出了在多項基準測試中逼近甚至超越GPT-4o的V3系列;阿里巴巴的通義千問Qwen系列已成為全球下載量最大的開源模型家族之一,其Qwen-2.5在代碼生成和數學推理方面的表現尤為突出;位元組跳動、百度、智譜AI等公司亦各有建樹。中國AI行業已經從「追趕者」轉變為「領跑者」——至少在開源模型和性價比這兩個維度上。

這種集體崛起的背後有多重驅動因素。首先是中國龐大的AI工程師人才池和相對較低的勞動力成本,使得中國公司能夠以遠低於西方同行的預算完成模型訓練和迭代。其次是中國國內激烈的市場競爭——數十家AI公司在同一市場中爭奪用戶和資源——迫使每一家公司都必須在性能和成本之間尋找最優平衡點。第三,中國政府對AI產業的政策支持——包括算力基礎設施建設、數據開放政策和人才培養計劃——為行業提供了有利的發展環境。最後,美國對華芯片出口管制反而在某種程度上加速了中國AI公司在算法效率和架構創新方面的突破——當你無法通過堆疊更多GPU來提升性能時,就被迫在軟件層面尋找更聰明的解決方案。MoE架構的廣泛採用正是這種「被制裁倒逼出來的創新」的典型例證。

中國AI開源三巨頭:2026年版圖一覽

DeepSeek:以R1推理模型和V3通用模型聞名,在數學推理和代碼生成方面表現突出。其開源策略和極低定價率先打響了中國AI的價格戰第一槍,被視為挑戰OpenAI的最強中國選手。2025年初的R1發佈被部分分析師認為是中國AI產業的「Sputnik時刻」。

阿里巴巴通義千問(Qwen):依托阿里雲的基礎設施優勢,Qwen系列已成為全球下載量最大的開源模型家族之一。Qwen-2.5在HuggingFace上的累計下載量超過數千萬次,其輕量級版本被廣泛部署在邊緣設備和移動端。阿里雲的全球數據中心網絡使得Qwen在亞太地區的延遲表現尤為出色。

MiniMax(M2.5):以MoE架構實現極致性價比,MIT開源授權最為寬鬆。M2.5的2300億參數中僅激活100億的設計,使其在推理成本和部署門檻上具備顯著優勢。其M2.5-Lightning變體的每秒100 token推理速度,使其在實時應用場景中具備獨特競爭力。

共同趨勢:三者均採用開源策略、主打性價比、並積極開拓海外市場。這一趨勢正在重塑全球AI產業的競爭格局,尤其對以高定價支撐高研發投入的西方AI實驗室構成結構性壓力。

六、西方AI實驗室的困境:護城河還是幻象?

M2.5的發佈,以及更廣泛的中國AI價格戰浪潮,正在迫使Anthropic、OpenAI和Google DeepMind等西方AI巨頭重新審視自身的商業模式和戰略定位。長期以來,這些公司的核心敘事建立在「技術領先 = 定價權」的邏輯之上——只要我們的模型是最好的,客戶就願意為最好的支付溢價。然而,當一個以三十三分之一價格提供的替代品在大多數實際應用場景中達到了「足夠好」的水平時,這一邏輯的基礎開始動搖。

歷史上的技術行業並不缺乏類似的先例。個人電腦市場在1990年代經歷了類似的「性能足夠好」轉折點——當中低價位的PC能夠滿足大多數用戶的日常需求時,消費者停止為頂級配置支付巨額溢價,整個行業的利潤率從此進入長期下行通道。智能手機市場在2015年前後經歷了相似的過程——中國品牌以三分之一的價格提供八成以上的體驗,迫使蘋果和三星不得不向服務收入轉型。AI行業是否正在進入同樣的階段?

西方AI實驗室的潛在應對策略包括幾個方向。一是向垂直化、專業化的解決方案轉型——不再單純出售API調用,而是提供針對特定行業(金融、醫療、法律等)的深度定制服務,通過領域知識和合規能力構建差異化壁壘。二是加速開發下一代技術——如更強的推理能力、更長的上下文窗口、更深的多模態整合——以維持技術代差。三是擁抱「平台化」戰略,將自身定位為AI應用生態的基礎設施提供者,通過開發者工具、企業集成方案和數據服務等附加價值來彌補核心模型API收入的下降。然而,每一條路徑都面臨着中國競爭對手的快速跟進——中國AI公司在垂直場景、技術迭代和平台生態方面的執行速度,往往令西方同行始料未及。

七、MIT開源授權的全球影響:一把雙刃劍

M2.5採用MIT授權協議發佈,這一決定的影響遠超商業層面,觸及AI治理和地緣政治的深層議題。MIT許可證的核心條款極為簡潔:任何人可以自由使用、複製、修改、合併、出版、分發、再授權和銷售該軟件的副本,唯一的條件是在副本中保留原始的版權聲明和許可聲明。這意味着,從矽谷的科技巨頭到非洲的初創企業,從學術研究機構到政府部門,任何實體都可以在不受限制的情況下將M2.5用於任何目的。

對全球AI生態而言,這種徹底的開源帶來了多重影響。正面而言,它大幅降低了AI技術的獲取門檻,使得資源有限的發展中國家機構和中小企業也能夠接觸到前沿水平的AI能力。對於學術研究者而言,MIT授權意味着他們可以自由地對M2.5進行深入研究、修改和擴展,這對推動AI科學的進步具有重要意義。然而,徹底的開源也意味着對模型使用方式的控制幾乎完全喪失——任何人都可以將M2.5用於虛假資訊生成、網絡攻擊輔助或其他有害目的,而MiniMax在法律上對此幾乎沒有追索權。

從地緣政治視角看,中國AI公司通過MIT開源策略向全球輸出技術能力,正在改變AI技術的全球分佈格局。當全球數以萬計的開發者和企業開始基於中國開源模型構建其AI應用時,中國的技術標準、架構設計和工程實踐將逐漸滲透至全球AI生態的底層基礎設施中。這種影響力是深遠且難以逆轉的——即便未來地緣政治局勢導致中西方技術脫鉤加速,已經廣泛部署的開源模型及其衍生品不可能被輕易替換。對於試圖在AI領域維持「技術主權」的各國政府而言,中國開源模型的全球擴散構成了一個需要認真評估的長期戰略議題。

八、香港機遇:左右逢源的獨特優勢

在全球AI行業日益呈現中西方兩大陣營分化態勢的背景下,香港企業和開發者正處於一個獨特的戰略位置。作為中國的特別行政區,香港可以無障礙地接入MiniMax M2.5、DeepSeek、通義千問等中國AI模型及其API服務。同時,作為國際金融中心和自由港,香港企業目前仍然能夠使用Claude、GPT-5.2、Gemini等西方AI服務。這種「左右逢源」的能力,在全球範圍內是極為稀缺的資源。

對於香港的初創企業和中小型企業而言,M2.5的出現帶來了立即可行的成本優化機會。以一家日均處理一百萬個token的AI應用為例,從Claude Opus 4.6切換至M2.5,每月的API成本將從約$150美元降至約$4.50美元。對於處理量更大的企業級應用——如客戶服務自動化、文檔分析平台或金融數據處理系統——節省的成本可能達到每年數十萬甚至上百萬港元。在香港這個營商成本居高不下的城市,這種級別的成本削減足以改變一家初創企業的生死命運。

然而,精明的香港企業不會簡單地將所有AI需求一股腦地遷移至最便宜的選項。更明智的策略是構建「多模型架構」——根據不同任務的性質和要求,智能地在中西方模型之間切換。對於需要最高推理能力和準確性的關鍵任務——如法律文件審查、醫療輔助決策或高風險金融分析——可以繼續使用Claude Opus 4.6或GPT-5.2等頂級模型;對於大批量、對成本敏感但對精確度要求相對寬鬆的任務——如初級客戶查詢處理、內容摘要生成或數據預處理——則可以切換至M2.5以大幅降低成本。M2.5在中文處理方面的天然優勢,更使其在面向本地市場的中文應用場景中尤為適用。

從更宏觀的角度看,香港正處於建設自身AI產業生態的關鍵窗口期。特區政府在最新的財政預算案中已明確將AI列為戰略發展重點,並承諾在基礎設施、人才引進和產業扶持方面加大投入。M2.5等高性價比開源模型的出現,為香港AI生態的發展提供了新的可能性——當構建AI應用的基礎成本大幅下降時,更多的香港創業者和中小企業將能夠負擔得起AI驅動的產品創新,這將從根本上擴大香港AI產業的參與者基數和創新活力。香港若能善用其同時接入中西方AI技術的獨特優勢,打造成為AI應用創新和跨境AI服務的區域樞紐,則在這場全球AI競賽中不僅不會被邊緣化,反而可能找到一條差異化的崛起路徑。