AI硬體
Meta 採購數以百萬計 AWS Graviton CPU:AI 代理工作負載帶動『非 GPU』新戰線
Meta 與 AWS 簽署大量 Graviton CPU 使用協議,反映 AI 從訓練走向代理推理後,CPU 與整體系統設計的重要性正在上升。
產業訊號:AI 的下一段增量,可能不只靠 GPU
過去兩年,AI 算力焦點幾乎完全落在 GPU 之上:誰拿到更多 GPU,誰就能訓練更大模型。但隨著企業把模型用於「代理化」應用(例如多步驟推理、程式碼生成、搜尋與任務協調),大量計算開始轉向推理與系統層的吞吐需求。Meta 近日與 AWS 達成協議,將使用數以百萬計的 AWS Graviton 晶片來支撐其 AI 需求,凸顯 CPU 與整體平台在代理工作負載中的角色正在被重新定價。
為何是 Graviton:ARM 架構 CPU 與雲端供應模式
Graviton 是 AWS 的自研 ARM 架構 CPU,屬於通用運算處理器而非 GPU。這次交易的關鍵在於:訓練仍高度依賴 GPU,但一旦模型訓練完成,代理在實際執行時會產生大量「通用運算」需求,包括狀態管理、工具調用、搜尋、程式運行與多代理協同。對雲端供應商而言,若能把這些推理與協同的底層算力以自研 CPU 供應,便可在成本與供應鏈上取得更主動的控制權。
對市場的含意:從單點晶片競爭走向『系統』與『性價比』競爭
這宗交易也反映雲端競爭正在變得更立體:除了 GPU 配額,企業客戶亦會比較推理成本、延遲、可擴展性與整體價格表現。當 AI 代理成為企業日常流程的一部分,「每一次推理」的成本就會累積成可觀的營運開支。對香港與區內企業而言,未來選擇雲端與 AI 平台時,可能要同時評估 GPU、CPU、網路與儲存等整體架構,而不再只看模型能力或單一晶片規格。