DeepSeek V4「失蹤」之謎:多個預測窗口落空,獵鷹Alpha竟是小米模型,中國頂尖AI實驗室為何沉默?
截至2026年3月下旬,DeepSeek V4仍未公開發布,此前流傳的匿名「獵鷹Alpha(Hunter Alpha)」模型被路透社確認實為小米的MiMo-V2-Pro。DeepSeek的沉默打破了中國AI實驗室的高頻發布節奏,業界對其是否面臨算力限制、戰略調整或技術瓶頸眾說紛紜。
截至2026年3月下旬,DeepSeek V4仍未公開發布,此前流傳的匿名「獵鷹Alpha(Hunter Alpha)」模型被路透社確認實為小米的MiMo-V2-Pro。DeepSeek的沉默打破了中國AI實驗室的高頻發布節奏,業界對其是否面臨算力限制、戰略調整或技術瓶頸眾說紛紜。
根據LLM Stats的追蹤數據,2026年第一季度共記錄255個以上的AI模型發布,主要實驗室的更新節奏壓縮至每2至3週一次。Google的Gemini 3.1 Pro以77.1%的ARC-AGI-2得分領跑16項主要基準測試,Anthropic推出Claude Opus 4.6和Sonnet 4.6,OpenAI的GPT-5.2在AIME 2025數學基準上取得滿分,阿里巴巴Qwen3-Max-Thinking躋身前沿行列。
摩根士丹利在最新研究報告中警告,由美國頂尖AI實驗室史無前例的算力積累所推動,一場具有轉型意義的AI能力跨越即將在2026年上半年發生。OpenAI最新的GPT-5.4「思考」模型在GDPVal基準測試中得分83%,首次達到或超越人類專家在經濟價值任務上的表現水準。
Google推出以效率為核心的Gemini 3.1 Flash-Lite,延遲比前代降低60%,輸出速度提升45%,定價僅為每百萬輸入Token 0.25美元。此舉反映業界從追求極致性能轉向讓更多企業負擔得起前沿AI算力的趨勢。
OpenAI宣布永久關閉僅上線半年的Sora視頻生成應用,原因是GPU資源消耗過大。同日,執行長Sam Altman透露,下一代核心模型代號「Spud」已完成初步開發,並公布多項重大組織重整措施。
MIT研究人員發現了一種利用計算閒置時間加速推理模型訓練的新方法。核心思路是自動訓練一個小型「代理模型」來預測大型推理LLM的輸出,由大模型驗證,從而大幅減少大模型的計算工作量。測試結果顯示訓練速度翻倍,準確度不受影響,有望顯著降低AI訓練的成本與能耗。
OpenAI正式發布GPT-5.4,搭載1百萬Token超長上下文視窗,並整合自主執行多步驟工作流程的能力。在模擬真實桌面生產力任務的OSWorld-V基準測試中,GPT-5.4得分75%,首次超越人類基準線72.4%,標誌著AI從對話工具向自主數位工作者的關鍵躍升。
2026年3月,開源AI模型迎來密集發布潮:Mistral Small 3.1、Kimi K2.5、MiniMax M2.7、Xiaomi MiMo v2 Pro等多個重量級模型相繼推出,在部分基準測試上逼近甚至超越閉源商業模型。開源模型在算法效率和推論成本上的持續突破,正在快速縮小與專有模型的能力差距。