阿里巴巴Qwen 3.5領銜中國農曆新年AI攻勢:成本降60%,聲稱超越GPT-5.2

文章重點

  • 阿里巴巴2月16日發布Qwen 3.5,採用混合架構,每次推理僅激活170億參數(總397億)
  • 成本比前代降低60%,大工作負載性能提升8倍,支援201種語言和方言
  • 阿里巴巴聲稱Qwen 3.5在多項測試中超越GPT-5.2、Claude Opus 4.5和Gemini 3 Pro
  • Qwen 3.5提供開源版本,具備視覺代理能力——可自主控制桌面和手機應用
  • 智譜AI的GLM-5、字節跳動的Doubao和即將發布的DeepSeek新模型構成中國AI軍備競賽

農曆新年的AI煙火

去年農曆新年,DeepSeek R1的突然發布震驚了全球科技界。今年,中國AI公司似乎已經將農曆新年檔期視為了一個傳統——集體在節日前後密集發布新模型。

2月16日,阿里巴巴雲在中國發布了通義千問(Qwen)3.5,這是專為「代理AI時代」設計的新一代模型。與此同時,字節跳動的Seedance 2.0、智譜AI的GLM-5、以及即將到來的DeepSeek新模型,構成了一場中國AI的多頭並進攻勢。

Qwen 3.5的技術亮點

Qwen 3.5的架構設計充分體現了中國AI實驗室在效率方面的持續追求。模型採用混合架構——總參數量397億,但每次前向傳播僅激活170億參數。這種「稀疏激活」的設計大幅降低了推理成本和延遲,同時保持了大模型的能力上限。

在效率方面,阿里巴巴表示Qwen 3.5的成本比前代降低60%,在大工作負載上的性能提升8倍。語言覆蓋範圍也從前代的82種語言擴展到201種語言和方言——這是一個值得關注的數字,意味著Qwen 3.5在多語言應用場景中具備顯著優勢。

原生多模態和代理能力

Qwen 3.5被設計為「原生多模態」——能夠在單一系統中同時理解文字、圖片和視頻,而非通過外掛模組拼接。這意味著模型可以直接處理混合媒體的輸入,例如分析一張包含文字說明的產品圖片。

更引人注目的是Qwen 3.5的視覺代理能力。模型可以獨立控制桌面和手機應用程序——解讀視覺界面、點擊按鈕、填寫表單——而無需人類介入。這將Qwen 3.5從一個「回答問題的工具」升級為一個「可以操作電腦的代理」。

397億
總參數量
170億
每次激活參數
201
支援語言和方言數量
60%
成本降低幅度

基準測試:可信度幾何

阿里巴巴公布的基準測試結果顯示Qwen 3.5在部分測試中超越了GPT-5.2、Claude Opus 4.5和Gemini 3 Pro。但在AI模型評測領域,自我報告的基準測試成績需要審慎解讀——選擇性展示有利基準是行業慣例,獨立驗證的結果往往有所不同。

更有意義的指標可能是市場的實際選擇。目前,字節跳動的Doubao聊天機器人以1.55億週活躍用戶領先中國市場,DeepSeek以8,160萬位居第二。阿里巴巴的通義千問仍在追趕。

開源策略的延續

Qwen 3.5提供開源版本,允許用戶下載、運行、微調和部署。這延續了中國AI實驗室對開源的廣泛擁抱——一種與美國閉源路線截然不同的戰略選擇。

正如MIT Technology Review所觀察的,2026年越來越多的矽谷應用正在悄悄使用中國開源模型作為底層技術。開源策略雖然犧牲了短期的直接商業收益,但在生態系統建設和全球影響力方面帶來了巨大的戰略回報。

中國AI軍備競賽全景

Qwen 3.5只是這場多方競爭中的一個參與者:

智譜AI在2月11日發布了開源GLM-5模型,定位為「代理智能和多步推理」。字節跳動的Doubao聊天機器人佔據市場領導地位。DeepSeek預計在未來數天發布新一代模型,有望再次掀起基準測試的軍備競賽。月之暗面(Moonshot AI)正在尋求100億美元估值。

對香港和大灣區的意義

中國AI模型的快速進步對香港企業有直接的實用價值。Qwen 3.5的201種語言覆蓋和優秀的中文理解能力,使其成為港企部署中文AI應用的有力選項。開源版本更允許企業在自有基礎設施上運行,滿足數據本地化的需求。

然而,在中美科技博弈的大背景下,香港企業在選擇AI基礎模型時需要考慮更多因素——包括供應鏈穩定性、合規要求和國際客戶的態度。務實的做法可能是維持多模型策略,根據不同場景選擇最適合的模型。