MIT研究突破：新方法使大型語言模型訓練速度翻倍，同時保持準確度

人工智能訓練的能源消耗和計算成本，一直是制約AI進一步普及的重大瓶頸。MIT研究人員的一項最新突破，或許為解決這個問題提供了一個優雅的思路：讓大模型和小模型互相協作，用閒置算力換取訓練效率。

核心創新：以閒制閒

這項研究的核心洞察在於，大型推理語言模型（Reasoning LLM）在訓練過程中，存在大量的計算「閒置時間」——模型在等待驗證、數據加載或梯度更新時，GPU資源處於部分空閒狀態。

MIT的方案充分利用了這段閒置時間：

研究團隊在多個推理語言模型上測試了這一方法，結果一致顯示：

訓練速度翻倍意味著：在相同的時間和預算下，AI公司可以進行兩倍的訓練迭代，更快速地開發和優化模型。此外，對於受算力限制的學術機構和中小企業，這一方法也有助於降低開發前沿AI模型的門檻。

這項研究為AI訓練效率開闢了一條新的優化路徑，也再次印證了MIT在基礎AI研究領域的持續領先地位。