Meta Llama 4多模態發布:開源AI挑戰GPT-5

文章重點

  • Meta發布Llama 4系列:Scout、Maverick、Behemoth三款模型
  • 原生多模態架構,支持文字、圖像、影片、音訊輸入
  • 採用專家混合(MoE)設計,效率大幅提升
  • 開放權重下載,但商業使用有限制條款

開源AI的新高度

Meta正式發布Llama 4系列,這是該公司迄今最雄心勃勃的AI模型。三款模型Scout、Maverick和Behemoth分別針對不同場景,標誌著開源AI的新高度。

三款模型定位

Llama 4 Scout

  • 參數:170億(活躍160億)
  • 上下文:10萬Token
  • 定位:輕量級、高效率,適合邊緣部署
  • 表現:超越Gemma 3和Qwen 3

Llama 4 Maverick

  • 參數:4000億(活躍170億)
  • 上下文:100萬Token
  • 定位:主力模型,平衡性能與成本
  • 表現:超越GPT-4o和Gemini 2.0 Pro

Llama 4 Behemoth

  • 參數:2萬億(仍在訓練中)
  • 定位:旗艦模型,對標GPT-5 Pro
  • 預計:2026年Q2發布

技術突破

原生多模態

Llama 4首次採用原生多模態架構,從訓練開始就統一處理文字、圖像、影片和音訊,而非後期拼接。

專家混合(MoE)

Maverick有4000億參數但每次推理只使用170億,大幅降低運算成本同時保持性能。

超長上下文

Maverick支持100萬Token上下文,可以處理整本書籍或數小時的影片。

開源爭議

雖然Meta稱Llama 4為「開源」,但批評者指出:

  • 商業使用需接受授權條款
  • 月活超過7億的公司需特別授權
  • 歐盟用戶被排除在外
  • 訓練數據和過程不透明

基準測試表現

Maverick在多項基準測試中表現優異:

  • MMLU-Pro:超越GPT-4o 5個百分點
  • 多模態理解:接近Gemini 2.0 Pro水平
  • 程式碼生成:SWE-Bench表現突出

生態系統

Meta同時發布了配套工具:

  • Llama Stack:標準化部署框架
  • Llama Guard 4:安全過濾器
  • API整合:AWS、Azure、Google Cloud

結語

Llama 4代表了開源AI的新高度,但「開源」的定義仍有爭議。對開發者來說,這提供了一個強大的替代選擇;對整個行業來說,這加劇了AI領域的競爭。