阿里巴巴通義千問3.5:3,970億參數、201種語言,中國開源AI的全球攻勢

文章重點

  • 阿里巴巴發布Qwen 3.5,開源版本擁有3,970億參數(MoE架構,170億活躍參數),閉源Plus版本支援100萬token上下文
  • 支援201種語言(前代僅82種),運行成本降低60%,效率提升8倍
  • 引入視覺代理能力,可自主操控桌面和移動設備,從「聊天機器人」升級為「行動代理」
  • 阿里巴巴宣稱在多項基準測試中超越GPT-5.2、Claude Opus 4.5和Gemini 3

開源的「核武器」:3,970億參數的全面衝擊

2026年2月17日,阿里巴巴發布了通義千問系列的最新版本Qwen 3.5。在一個閉源模型主導的市場中,阿里巴巴選擇了截然不同的路線:將一個擁有3,970億參數的龐大模型完全開源。

這個模型採用了混合專家(MoE)架構——Qwen3.5-397B-A17B,意味著雖然總參數量達到3,970億,但每次推理時只啟用170億個參數。這種設計在保持巨大知識儲備的同時,將運算成本控制在合理範圍內。

3,970億
總參數量
170億
活躍參數
201
支援語言數
8x
效率提升

從82到201種語言:全球化野心

Qwen 3.5最直觀的升級之一是語言支援數量從82種跳升至201種。這不僅是一個技術成就,更是一個明確的戰略信號:阿里巴巴正在將AI出海作為核心戰略。

覆蓋201種語言意味著Qwen 3.5理論上可以服務全球99%以上的人口。這對於發展中國家和小語種地區尤其重要——在過去,這些地區的語言往往在AI模型中得不到良好支援。MIT最近的一項研究發現,中國開源AI模型的總下載量已經超過美國模型,Qwen 3.5的多語言策略顯然是在加速這一趨勢。

視覺代理:超越聊天的下一步

Qwen 3.5最引人注目的新功能是「視覺代理」能力。這意味著模型不僅可以處理文字,還能「看見」電腦螢幕,理解界面元素,並自主操控桌面和移動設備來完成任務。

這直接對標了Anthropic的Claude電腦操控功能和OpenAI的代理功能。不同的是,Qwen 3.5的視覺代理能力是開源的——任何開發者都可以基於它構建自己的自主代理應用,而不需要依賴商業API。

Qwen Code:開發者的新工具

配合Qwen 3.5的發布,阿里巴巴同時開源了「Qwen Code」——一個面向開發者的命令行工具,類似於Anthropic的Claude Code。這進一步表明中國AI公司不僅在模型層面競爭,還在工具生態層面展開全面對抗。

基準測試的爭議:真的超越了GPT-5.2?

阿里巴巴宣稱Qwen 3.5在多項基準測試中超越了GPT-5.2、Claude Opus 4.5和Gemini 3。然而,這些聲明需要謹慎解讀。

首先,基準測試的選擇和配置可以顯著影響結果。其次,不同模型在不同任務上各有所長——一個模型在數學推理上的優勢不一定能轉化為程式開發上的優勢。

更客觀的觀察是:Qwen 3.5已經達到了與美國頂級閉源模型「同一量級」的水平,即使不是在所有任務上都全面超越。這本身就是一個巨大的成就,考慮到中國公司在獲取先進GPU方面受到出口管制的限制。

成本優勢:60%更便宜

除了性能提升,Qwen 3.5在經濟性方面也有顯著進步。阿里巴巴稱運行成本較前代降低60%,效率提升8倍。對於需要大規模部署AI的企業而言,成本往往是決定性因素。

這與Anthropic的Sonnet 4.6策略異曲同工——雙方都在試圖通過大幅降低頂級AI的使用成本,來加速企業採用。不同的是,作為開源模型,Qwen 3.5允許企業完全自主部署,避免了對外部API的依賴和相關的數據安全顧慮。

中美AI的「平行宇宙」

Qwen 3.5的發布進一步凸顯了中美AI競賽的特殊格局。美國主導的是閉源商業模式(OpenAI、Anthropic、Google),而中國則在開源領域建立了強大的影響力(DeepSeek、Qwen、MiniMax)。

這兩種模式各有優劣:閉源模型可以更好地保護商業利益和控制安全性,而開源模型則能更快地傳播技術、建立社區和佔領市場。從某種意義上說,中美AI產業正在以兩種完全不同的方式重塑全球技術格局。

對香港和亞太地區的影響

對於香港和亞太地區的企業和開發者而言,Qwen 3.5的發布有著特殊意義:

  • 中文能力優勢:作為中國公司開發的模型,Qwen在中文處理方面有著天然優勢。
  • 粵語支援:201種語言的覆蓋範圍意味著更好的粵語及其他亞洲語言支援。
  • 數據合規:企業可以在本地部署開源模型,避免將敏感數據傳輸到海外伺服器。
  • 成本優勢:60%的成本降低對於中小企業尤其具有吸引力。