文章重點
- Meta發布Llama 4系列:Scout、Maverick、Behemoth三款模型
- 原生多模態架構,支持文字、圖像、影片、音訊輸入
- 採用專家混合(MoE)設計,效率大幅提升
- 開放權重下載,但商業使用有限制條款
開源AI的新高度
Meta正式發布Llama 4系列,這是該公司迄今最雄心勃勃的AI模型。三款模型Scout、Maverick和Behemoth分別針對不同場景,標誌著開源AI的新高度。
三款模型定位
Llama 4 Scout
- 參數:170億(活躍160億)
- 上下文:10萬Token
- 定位:輕量級、高效率,適合邊緣部署
- 表現:超越Gemma 3和Qwen 3
Llama 4 Maverick
- 參數:4000億(活躍170億)
- 上下文:100萬Token
- 定位:主力模型,平衡性能與成本
- 表現:超越GPT-4o和Gemini 2.0 Pro
Llama 4 Behemoth
- 參數:2萬億(仍在訓練中)
- 定位:旗艦模型,對標GPT-5 Pro
- 預計:2026年Q2發布
技術突破
原生多模態
Llama 4首次採用原生多模態架構,從訓練開始就統一處理文字、圖像、影片和音訊,而非後期拼接。
專家混合(MoE)
Maverick有4000億參數但每次推理只使用170億,大幅降低運算成本同時保持性能。
超長上下文
Maverick支持100萬Token上下文,可以處理整本書籍或數小時的影片。
開源爭議
雖然Meta稱Llama 4為「開源」,但批評者指出:
- 商業使用需接受授權條款
- 月活超過7億的公司需特別授權
- 歐盟用戶被排除在外
- 訓練數據和過程不透明
基準測試表現
Maverick在多項基準測試中表現優異:
- MMLU-Pro:超越GPT-4o 5個百分點
- 多模態理解:接近Gemini 2.0 Pro水平
- 程式碼生成:SWE-Bench表現突出
生態系統
Meta同時發布了配套工具:
- Llama Stack:標準化部署框架
- Llama Guard 4:安全過濾器
- API整合:AWS、Azure、Google Cloud
結語
Llama 4代表了開源AI的新高度,但「開源」的定義仍有爭議。對開發者來說,這提供了一個強大的替代選擇;對整個行業來說,這加劇了AI領域的競爭。