Meta Llama 4發布:「開源」標籤引發的全球爭議

開放權重不等於開源?歐盟用戶被排除在外,科技巨頭使用需特別授權

🦙

本文重點

  • Llama 4於2025年4月5日發布,作為對DeepSeek挑戰的回應
  • 首發包含Maverick(170億活躍參數)和Scout,Behemoth(2萬億參數)仍在訓練中
  • 原生多模態設計,支援200種語言,多語言token比Llama 3增加10倍
  • 開源組織批評:Llama 4仍非真正開源,存在地域限制和使用限制

Llama 4:Meta的AI反擊戰

2025年4月5日,Meta正式發布Llama 4系列模型。這次發布被外界解讀為對中國AI公司DeepSeek崛起的直接回應。DeepSeek以極低成本訓練出高性能模型,震驚了整個AI產業,而Meta選擇以更強大的開放模型來鞏固其在AI生態系統中的地位。

Mark Zuckerberg在Instagram上宣布:「今天,我們發布了首批開源Llama 4模型,還有兩個更強大的版本即將推出。」然而,正是這個「開源」的說法,引發了一場關於AI模型開放性定義的激烈辯論。

Llama 4系列:技術規格解析

Llama 4首發包含兩個版本,第三個更強大的版本仍在訓練中:

170億 Maverick活躍參數
2萬億 Behemoth總參數
200 支援語言數

Maverick

Maverick是Llama 4的旗艦模型之一,採用混合專家(MoE)架構。它擁有170億活躍參數,配合128個專家模組,總參數量達到4000億。這種設計在保持高效能的同時,大幅降低了推理時的計算成本。

Scout

Scout是較輕量的版本,針對需要快速回應或資源受限環境進行優化。具體參數Meta尚未完全公開,但定位為適合邊緣部署的高效模型。

Behemoth(即將發布)

Behemoth是Meta目前正在訓練的巨型模型,擁有2880億活躍參數、16個專家和約2萬億總參數。這將是迄今為止最大的開放權重語言模型之一。

原生多模態:不只是語言模型

Llama 4的一大突破是原生多模態設計。所有Llama 4模型都採用早期融合技術,在預訓練階段就同時處理大量未標註的文字和視覺數據。這意味著模型從一開始就「看得見」,而不是後期才加上視覺能力。

在國際化方面,Llama 4在200種語言上進行預訓練,其中超過100種語言的訓練數據量超過10億token。整體多語言token數量是Llama 3的10倍,為開源社群的本地化微調提供了堅實基礎。

「開源」爭議:定義之戰

Llama 4發布後,開源組織(Open Source Initiative,OSI)立即發表聲明,批評Meta再次錯誤地使用「開源」一詞。

OSI指出:「Llama 4與其前代產品一樣,仍然不是任何意義上的開源。儘管如此,Meta仍持續錯誤地將Llama宣傳為『開源』。」

什麼是真正的開源?

根據開源定義,真正的開源軟體應該:

  • 允許自由使用、修改和分發
  • 提供完整的源代碼
  • 不限制使用者、使用領域或地域
  • 不要求額外的許可授權

Llama 4的限制

然而,Llama 4存在多項顯著限制:

地域限制:根據Llama 4可接受使用政策,歐盟地區的個人和公司無法使用這些模型。這種地域封鎖與開源精神完全背離。

商業使用限制:月活躍用戶超過7億的公司必須獲得Meta的特別授權才能使用Llama。這意味著Apple、Google、Amazon等科技巨頭需要另行談判,或者開發自己的模型。

缺乏訓練數據和代碼:Llama 4只提供模型權重,並不公開訓練數據集和完整的訓練代碼。這使得獨立研究者難以完全復現或驗證其聲稱的性能。

「開放權重」vs「開源」

更準確地說,Llama 4應該被稱為「開放權重」(Open Weight)模型,而非「開源」模型。開放權重意味著模型的參數可以自由下載和使用(在授權範圍內),但不包括完整的訓練流程透明度。

這種區分很重要,因為它影響到:

  • 可復現性:沒有訓練數據和代碼,研究者無法驗證或改進訓練方法
  • 安全審計:無法完全檢查模型是否存在有害偏見或安全漏洞的來源
  • 學術研究:限制了對大型語言模型訓練的科學研究

Meta的戰略考量

儘管存在爭議,Meta的策略有其商業邏輯:

生態系統建設:通過讓開發者免費使用強大的模型,Meta正在培養一個圍繞Llama的龐大開發者生態,這可能轉化為長期的平台優勢。

差異化競爭:與OpenAI、Google等閉源競爭對手相比,Llama的開放性(即使有限)仍是重要的差異化賣點。

成本分攤:讓社群參與微調和應用開發,實際上分攤了AI開發的成本和風險。

監管應對:「開源」標籤可能在未來的AI監管中獲得更寬鬆的待遇,雖然這一策略正受到質疑。

對開發者的實際影響

對於大多數開發者來說,Llama 4仍然是一個極具價值的資源:

小型企業和個人:可以自由使用Llama 4構建應用,無需支付API費用或擔心數據隱私。

中型企業:只要月活躍用戶不超過7億(絕大多數企業都不會觸及這個閾值),可以商業化部署Llama 4應用。

研究機構:可以在Llama 4基礎上進行微調和研究,但完全復現其訓練過程仍不可能。

歐盟用戶:目前被排除在外,需要等待政策變化或尋找替代方案。

結語

Llama 4的發布再次凸顯了AI領域中「開源」定義的模糊和爭議。Meta的策略——提供強大但有限制的模型——在商業上可能是明智的,但將其稱為「開源」確實引發了正當的批評。

對於AI社群來說,這場定義之戰的重要性超越了語義爭論。它涉及到AI發展的透明度、可及性和民主化等核心問題。隨著AI技術日益強大,如何在商業利益和公共利益之間取得平衡,將是整個產業需要持續面對的挑戰。

分享文章: