MIT研究突破:新方法使大型語言模型訓練速度翻倍,同時保持準確度
MIT研究人員發現了一種利用計算閒置時間加速推理模型訓練的新方法。核心思路是自動訓練一個小型「代理模型」來預測大型推理LLM的輸出,由大模型驗證,從而大幅減少大模型的計算工作量。測試結果顯示訓練速度翻倍,準確度不受影響,有望顯著降低AI訓練的成本與能耗。
第 31 頁,共 32 頁 · 共 316 篇文章
MIT研究人員發現了一種利用計算閒置時間加速推理模型訓練的新方法。核心思路是自動訓練一個小型「代理模型」來預測大型推理LLM的輸出,由大模型驗證,從而大幅減少大模型的計算工作量。測試結果顯示訓練速度翻倍,準確度不受影響,有望顯著降低AI訓練的成本與能耗。
OpenAI發布GPT-5.3-Codex-Spark,這是其首個正式部署於Cerebras晶圓級(wafer-scale)芯片而非Nvidia GPU的生產模型。此舉被視為OpenAI多元化AI算力供應鏈、降低對Nvidia單一依賴的重要戰略信號。
OpenAI正式發布GPT-5.4,搭載1百萬Token超長上下文視窗,並整合自主執行多步驟工作流程的能力。在模擬真實桌面生產力任務的OSWorld-V基準測試中,GPT-5.4得分75%,首次超越人類基準線72.4%,標誌著AI從對話工具向自主數位工作者的關鍵躍升。
全球頂級支付公司Stripe的AI代理系統「Minions」已達到每週自動生成超過1,300個生產就緒Pull Request的規模。任務從Slack訊息和Bug報告自動觸發,由大型語言模型生成代碼,經CI/CD流水線驗證後,人工審查後即可合并。這標誌著AI代理在頂尖科技公司的軟件開發流程中正式進入主流應用。
最新研究揭示,ChatGPT在生成回應時,雖然會從網絡檢索大量相關網頁,但最終僅有約15%的已檢索頁面出現在最終回應的引用中。這意味著傳統SEO的「排名」邏輯正在被顛覆——被AI檢索到並非被引用的保證,網站內容是否符合AI的「引用選擇邏輯」才是新的流量關鍵。
NVIDIA推出企業級AI Agent開發工具包,包含OpenShell安全運行環境、Nemotron模型系列,以及結合開源與前沿模型的AI-Q代理藍圖。工具包旨在讓企業以更低成本構建能夠推理、行動並完成複雜任務的自主AI代理,同時保持高準確度,並打破對單一AI供應商的依賴。
美國國防部長Pete Hegseth下令停止使用Anthropic的Claude AI後,五角大廈內部用戶普遍反映在尋找替代方案時面臨重大的操作挑戰。這一現象深刻揭示了AI平台一旦嵌入組織工作流程後的高度黏性——政治決策容易,實際替換代價高昂。
小米集團宣布未來三年將在人工智能領域投入至少87億美元,同時發布自研大型語言模型。此舉反映小米雄心勃勃的AI佈局,目標是在智能手機、電動汽車、智能家居等全產品線深度整合AI能力,在激烈的中國AI競賽中確立領先地位。
Google正式將Gemini的「個人智能(Personal Intelligence)」功能擴展至所有美國用戶,不再限制於付費訂閱者。該功能允許Gemini連接並分析用戶的Gmail、Google相冊和YouTube數據,在搜索、Chrome和Gemini應用中提供更具個人化的上下文感知回應,同時保持完全的用戶自主控制。
Google宣布Gemini全面整合至Workspace辦公套件,新增「幫我建立(Help me create)」、「用Gemini填充(Fill with Gemini)」等功能。用戶可從現有文件和電子郵件生成完整的簡報草稿,讓試算表自動填充即時網絡數據,並從現有文件一鍵生成整套幻燈片,大幅壓縮辦公創作時間。