Meta加速自研MTIA晶片路線圖：兩年內推四代，聚焦生成式AI推論效率

以推論為先：從推薦系統走向生成式AI

Meta公布MTIA自研晶片的新節奏，計畫在兩年內推進四代產品，並以更快於傳統晶片週期的速度迭代。MTIA 300已投入生產，主要用於推薦與排序等工作負載的訓練；後續的MTIA 400、450與500則被定位為可覆蓋多種工作負載，但在短中期將優先支援生成式AI的推論產線。對大型平台公司來說，推論成本與能源效率往往決定產品能否規模化，因此自研晶片可在記憶體頻寬、效率與特定算子上做更貼近模型的優化。

對產業的訊號：硬體與模型共同設計成為常態

Meta強調自研晶片不是取代既有供應商，而是以「組合式」策略搭配不同工作負載，反映AI基礎建設正走向多樣化：同一家公司可能同時部署通用GPU與客製化加速器，以平衡成本、供應與效能。若MTIA在推論端取得更高的效能密度，將有助於在內容生成、廣告、客服與創作者工具等場景更密集地使用生成式AI。同時，這也向市場釋出訊號：大型雲與平台會把硬體、網路與模型訓練/推論流程一起設計，供應鏈競爭不只在晶片製程，也在整體系統工程與運營能力。