← 所有新聞

#AI-research 相關新聞

共 11 篇文章

AI研究

比利時研究揭示AI招聘工具性別偏見比想像中更深:去除明顯標記後,AI仍用「代理變量」懲罰女性求職者

比利時最新研究發現,AI輔助招聘工具的性別偏見遠比此前認知更加根深蒂固。即使在刪除姓名、性別等明顯性別標記之後,AI模型仍會通過分析特定興趣愛好、語言表達模式和職業空白期等「代理變量」來識別並懲罰女性求職者。研究結果對企業合規評估和AI公平性工程帶來深遠挑戰。

LLM

Anthropic意外洩露次世代模型「Claude Mythos」:性能遠超Opus 4.6,網絡安全能力引發警報

Anthropic因內容管理系統配置失誤,意外在官網公開了近3,000份未發佈文件,其中包含描述全新模型「Claude Mythos」(代號Capybara)的草稿博文。文件顯示該模型在軟件編碼、學術推理和網絡安全測試上大幅超越現有最強模型Claude Opus 4.6,但同時警告其網絡安全能力「遠超任何現有AI模型」,可能加速網絡攻擊與防禦之間的軍備競賽。

LLM

2026年Q1 AI模型競賽總結:255個新模型、每2-3週一次發布、Gemini 3.1 Pro稱霸16項基準

根據LLM Stats的追蹤數據,2026年第一季度共記錄255個以上的AI模型發布,主要實驗室的更新節奏壓縮至每2至3週一次。Google的Gemini 3.1 Pro以77.1%的ARC-AGI-2得分領跑16項主要基準測試,Anthropic推出Claude Opus 4.6和Sonnet 4.6,OpenAI的GPT-5.2在AIME 2025數學基準上取得滿分,阿里巴巴Qwen3-Max-Thinking躋身前沿行列。

AI研究

密西根大學AI系統數秒分析腦部MRI,準確識別神經系統疾病並分診緊急程度

密西根大學研究人員開發出一套AI系統,能在數秒內解讀腦部MRI掃描影像,準確識別廣泛的神經系統疾病,並判斷哪些病例需要緊急處置。這一突破有望大幅縮短目前長達數小時甚至數天的腦部影像診斷等待時間,在急診醫學和偏遠地區醫療資源短缺的場景中具有重大應用潛力。

AI研究

MIT研究突破:新方法使大型語言模型訓練速度翻倍,同時保持準確度

MIT研究人員發現了一種利用計算閒置時間加速推理模型訓練的新方法。核心思路是自動訓練一個小型「代理模型」來預測大型推理LLM的輸出,由大模型驗證,從而大幅減少大模型的計算工作量。測試結果顯示訓練速度翻倍,準確度不受影響,有望顯著降低AI訓練的成本與能耗。