NVIDIA 200億美元Groq交易:通用GPU時代的終結號角

文章重點

  • NVIDIA與推理晶片公司Groq達成200億美元戰略授權協議,是AI晶片領域最大規模的非併購交易
  • NVIDIA實質承認通用GPU時代正在終結,推理工作負載正分化為兩條截然不同的路線
  • 「深度推理」(需要長時間思考的任務)仍適合GPU,「即時推理」(低延遲回應)則轉向專用晶片
  • 此交易開啟AI基礎設施「四方戰爭」:GPU製造商、專用推理晶片、雲端提供商、AI開發者
  • 分析師認為此舉是NVIDIA的「防禦性收編」策略,而非對自身產品的否定

200億美元的戰略轉折

在AI產業歷史上,2026年2月將因一筆200億美元的交易而被銘記。NVIDIA與推理專用晶片公司Groq簽署的戰略授權協議,不僅是AI晶片領域最大規模的非併購交易,更象徵著一個時代的轉折:通用GPU主導AI計算的格局正在鬆動。

VentureBeat率先報道了這筆交易的深層含義,標題直截了當——「NVIDIA剛剛承認通用GPU時代正在終結」。這並非外界的過度解讀,而是NVIDIA用200億美元的真金白銀做出的戰略表態。

推理的「大分裂」

理解這筆交易的關鍵,在於認識到AI推理工作負載正在經歷一場根本性的分化:

200億
交易金額(美元)
2條
推理路線分化
1000+
Groq LPU每秒生成Token數
10x
NVIDIA Rubin推理成本降幅
  • 深度推理(Deep Inference):需要AI模型進行長時間「思考」的任務,如複雜數學證明、科學研究、程式碼生成等。這類工作需要大量記憶體和計算能力,GPU仍然是最佳選擇。
  • 即時推理(Instant Inference):需要極低延遲回應的任務,如對話、即時搜尋、語音助手等。這類工作對速度的要求遠高於深度,專用推理晶片如Groq的LPU(語言處理單元)具有明顯優勢。

Groq的技術優勢

Groq的LPU(Language Processing Unit)架構與GPU有著根本性的不同。GPU的設計初衷是圖形處理中的大規模平行計算,後來被轉用於AI訓練和推理。而LPU從一開始就是專為語言模型推理設計的。

Groq的核心優勢在於「確定性計算」——每次推理運算的時間是完全可預測的,不存在GPU中常見的記憶體瓶頸問題。這使得Groq在低延遲推理場景中能夠實現每秒超過1,000個Token的生成速度,遠超傳統GPU推理。

NVIDIA的「防禦性收編」

那麼,為什麼AI晶片霸主NVIDIA要花200億美元與一個潛在競爭對手合作?分析師普遍認為,這是一種「防禦性收編」策略。

NVIDIA的戰略邏輯

與其讓Groq成長為一個獨立的競爭威脅,不如通過授權協議將其納入自己的生態系統。NVIDIA透過此交易獲得了Groq的LPU技術授權,可以在未來的產品中整合即時推理能力,同時確保Groq的客戶仍需使用NVIDIA的訓練基礎設施。

AI基礎設施的「四方戰爭」

這筆交易也揭示了AI基礎設施正在進入一個更加複雜的競爭格局。VentureBeat分析指出,AI計算的未來將是一場「四方戰爭」:

  • GPU製造商(NVIDIA、AMD):控制訓練和深度推理市場
  • 專用推理晶片(Groq、Cerebras、Positron):瞄準即時推理和低延遲場景
  • 雲端提供商(AWS、Google、Microsoft):正在設計自研晶片,試圖減少對NVIDIA的依賴
  • AI開發者(OpenAI、Anthropic、Meta):開始多元化硬體策略,不再只依賴單一供應商

對OpenAI Cerebras合作的呼應

值得注意的是,NVIDIA的Groq交易與OpenAI近期與Cerebras Systems的合作形成了有趣的對照。OpenAI的GPT-5.3-Codex-Spark模型選擇在Cerebras硬體上運行,實現了每秒超過1,000個Token的超低延遲推理。這清楚表明,即使是NVIDIA最大的客戶也在積極尋找GPU以外的推理方案。

投資者的兩難

消息公布後,NVIDIA股價在盤後交易中小幅下跌約2%,反映出投資者對「通用GPU時代終結」敘事的擔憂。然而,多數華爾街分析師仍然看好NVIDIA,認為AI訓練市場的增長足以抵消推理市場的分化。

Morgan Stanley分析師在研究報告中指出:「NVIDIA的Groq交易不是一個弱勢信號,而是一個適應信號。歷史上最成功的科技公司都是那些願意自我顛覆的公司。」