← 所有新聞

#LLM 相關新聞

共 8 篇文章

LLM

2026年Q1 AI模型競賽總結:255個新模型、每2-3週一次發布、Gemini 3.1 Pro稱霸16項基準

根據LLM Stats的追蹤數據,2026年第一季度共記錄255個以上的AI模型發布,主要實驗室的更新節奏壓縮至每2至3週一次。Google的Gemini 3.1 Pro以77.1%的ARC-AGI-2得分領跑16項主要基準測試,Anthropic推出Claude Opus 4.6和Sonnet 4.6,OpenAI的GPT-5.2在AIME 2025數學基準上取得滿分,阿里巴巴Qwen3-Max-Thinking躋身前沿行列。

AI研究

MIT研究突破:新方法使大型語言模型訓練速度翻倍,同時保持準確度

MIT研究人員發現了一種利用計算閒置時間加速推理模型訓練的新方法。核心思路是自動訓練一個小型「代理模型」來預測大型推理LLM的輸出,由大模型驗證,從而大幅減少大模型的計算工作量。測試結果顯示訓練速度翻倍,準確度不受影響,有望顯著降低AI訓練的成本與能耗。