DeepSeek V4「失蹤」之謎:多個預測窗口落空,獵鷹Alpha竟是小米模型,中國頂尖AI實驗室為何沉默?
截至2026年3月下旬,DeepSeek V4仍未公開發布,此前流傳的匿名「獵鷹Alpha(Hunter Alpha)」模型被路透社確認實為小米的MiMo-V2-Pro。DeepSeek的沉默打破了中國AI實驗室的高頻發布節奏,業界對其是否面臨算力限制、戰略調整或技術瓶頸眾說紛紜。
截至2026年3月下旬,DeepSeek V4仍未公開發布,此前流傳的匿名「獵鷹Alpha(Hunter Alpha)」模型被路透社確認實為小米的MiMo-V2-Pro。DeepSeek的沉默打破了中國AI實驗室的高頻發布節奏,業界對其是否面臨算力限制、戰略調整或技術瓶頸眾說紛紜。
根據LLM Stats的追蹤數據,2026年第一季度共記錄255個以上的AI模型發布,主要實驗室的更新節奏壓縮至每2至3週一次。Google的Gemini 3.1 Pro以77.1%的ARC-AGI-2得分領跑16項主要基準測試,Anthropic推出Claude Opus 4.6和Sonnet 4.6,OpenAI的GPT-5.2在AIME 2025數學基準上取得滿分,阿里巴巴Qwen3-Max-Thinking躋身前沿行列。
斯旺西大學針對逾800名參與者開展的大規模研究發現,與AI協作創作的人類,在創意輸出的新穎性和多樣性上顯著優於單獨創作的對照組,AI在創作過程中扮演的是「創作協作者」角色。這一發現挑戰了「AI會扼殺人類創造力」的主流擔憂,為AI與人類的創意協作提供了實證基礎。
密西根大學研究人員開發出一套AI系統,能在數秒內解讀腦部MRI掃描影像,準確識別廣泛的神經系統疾病,並判斷哪些病例需要緊急處置。這一突破有望大幅縮短目前長達數小時甚至數天的腦部影像診斷等待時間,在急診醫學和偏遠地區醫療資源短缺的場景中具有重大應用潛力。
NASA火星探測車「毅力號」完成了人類史上首次由人工智能規劃的火星地表行駛任務。Anthropic的Claude視覺語言模型分析軌道影像與地形數據,自主生成安全路徑,兩次行駛共覆蓋456公尺,取代了人類操作員手動執行28年的複雜規劃工作。
非營利AI研究機構Allen Institute for AI(Ai2)正式發布MolmoWeb,一款基於Molmo 2多模態模型的開源網頁操作代理。與閉源系統不同,開發者可完整審視其工作原理。8B參數版本在網頁導航基準測試中,性能超越部分OpenAI、Google和Anthropic的商業產品。
MIT研究人員發現了一種利用計算閒置時間加速推理模型訓練的新方法。核心思路是自動訓練一個小型「代理模型」來預測大型推理LLM的輸出,由大模型驗證,從而大幅減少大模型的計算工作量。測試結果顯示訓練速度翻倍,準確度不受影響,有望顯著降低AI訓練的成本與能耗。
最新研究揭示,ChatGPT在生成回應時,雖然會從網絡檢索大量相關網頁,但最終僅有約15%的已檢索頁面出現在最終回應的引用中。這意味著傳統SEO的「排名」邏輯正在被顛覆——被AI檢索到並非被引用的保證,網站內容是否符合AI的「引用選擇邏輯」才是新的流量關鍵。