AI硬體

Meta加速自研MTIA晶片路線圖:兩年內推四代,聚焦生成式AI推論效率

Meta表示將在兩年內部署MTIA 300/400/450/500四代自研晶片,先以推薦系統訓練與生成式AI推論為主,提升效能與能源效率。

以推論為先:從推薦系統走向生成式AI

Meta公布MTIA自研晶片的新節奏,計畫在兩年內推進四代產品,並以更快於傳統晶片週期的速度迭代。MTIA 300已投入生產,主要用於推薦與排序等工作負載的訓練;後續的MTIA 400、450與500則被定位為可覆蓋多種工作負載,但在短中期將優先支援生成式AI的推論產線。對大型平台公司來說,推論成本與能源效率往往決定產品能否規模化,因此自研晶片可在記憶體頻寬、效率與特定算子上做更貼近模型的優化。

對產業的訊號:硬體與模型共同設計成為常態

Meta強調自研晶片不是取代既有供應商,而是以「組合式」策略搭配不同工作負載,反映AI基礎建設正走向多樣化:同一家公司可能同時部署通用GPU與客製化加速器,以平衡成本、供應與效能。若MTIA在推論端取得更高的效能密度,將有助於在內容生成、廣告、客服與創作者工具等場景更密集地使用生成式AI。同時,這也向市場釋出訊號:大型雲與平台會把硬體、網路與模型訓練/推論流程一起設計,供應鏈競爭不只在晶片製程,也在整體系統工程與運營能力。