比利時研究揭示AI招聘工具性別偏見比想像中更深:去除明顯標記後,AI仍用「代理變量」懲罰女性求職者
比利時最新研究發現,AI輔助招聘工具的性別偏見遠比此前認知更加根深蒂固。即使在刪除姓名、性別等明顯性別標記之後,AI模型仍會通過分析特定興趣愛好、語言表達模式和職業空白期等「代理變量」來識別並懲罰女性求職者。研究結果對企業合規評估和AI公平性工程帶來深遠挑戰。
第 28 頁,共 32 頁 · 共 316 篇文章
比利時最新研究發現,AI輔助招聘工具的性別偏見遠比此前認知更加根深蒂固。即使在刪除姓名、性別等明顯性別標記之後,AI模型仍會通過分析特定興趣愛好、語言表達模式和職業空白期等「代理變量」來識別並懲罰女性求職者。研究結果對企業合規評估和AI公平性工程帶來深遠挑戰。
三月下旬,多家頂級科技公司相繼宣布大規模裁員,明確將AI技術替代列為核心原因。Oracle計劃裁減2至3萬名員工,將節省的80至100億美元轉向AI基礎設施;Atlassian裁員約1,600人(佔全球員工10%)同時任命兩位AI聚焦的新CTO;支付公司Block裁減近40%員工,CEO Jack Dorsey直言這些職位「已被AI工具取代」。
Anthropic因內容管理系統配置失誤,意外在官網公開了近3,000份未發佈文件,其中包含描述全新模型「Claude Mythos」(代號Capybara)的草稿博文。文件顯示該模型在軟件編碼、學術推理和網絡安全測試上大幅超越現有最強模型Claude Opus 4.6,但同時警告其網絡安全能力「遠超任何現有AI模型」,可能加速網絡攻擊與防禦之間的軍備競賽。
OpenAI於3月5日發布GPT-5.4,這是首款在OSWorld電腦操作基準測試中以75%得分超越人類(72.4%)的AI模型,標誌著AI從對話工具向自主數字助理的實質性轉型。新模型整合了原生電腦使用能力、100萬token上下文窗口,並在專業工作(GDPval 83%)和網頁研究(BrowseComp 82.7%)等多項基準上大幅刷新紀錄。
模型上下文協議(MCP)在2026年3月突破9,700萬次安裝,每一家主要AI提供商現已發布MCP相容工具,標誌著MCP從Anthropic提出的技術提案,正式演進為整個AI代理生態系統的基礎連接標準,其地位類比HTTP之於互聯網。
OpenAI近日在ChatGPT中大幅擴展購物功能,整合Agentic Commerce Protocol帶來視覺化產品發現和Walmart應用體驗,同時推出Codex插件標準化AI工作流,初始整合覆蓋Figma、Notion、Gmail和Slack等20多個主流工具,標誌著ChatGPT從對話助理向AI代理商務平台的戰略轉型。
據Axios最新報導,Anthropic與五角大廈之間已有秘密後台溝通渠道,內部人士透露兩家機構在自主武器和大規模監控兩項核心爭議上「幾乎已達成共識」。分析人士指出,Anthropic的Claude在軍事應用上遠超競爭對手,若持續遭黑名單制裁,Anthropic未來恐損失數百億美元軍政府合約。
Apple於三月初發布搭載M5 Pro和M5 Max芯片的全新MacBook Pro,採用全新「融合架構」(Fusion Architecture),在每個GPU核心中內建神經加速器,實現較M4上代機型高達4倍、較M1時代高達8倍的AI推理效能。MacBook Pro首次能夠本地運行業界級大型語言模型,為開發者和創意專業人士帶來無需雲端的AI工作流。
截至2026年3月下旬,DeepSeek V4仍未公開發布,此前流傳的匿名「獵鷹Alpha(Hunter Alpha)」模型被路透社確認實為小米的MiMo-V2-Pro。DeepSeek的沉默打破了中國AI實驗室的高頻發布節奏,業界對其是否面臨算力限制、戰略調整或技術瓶頸眾說紛紜。
根據LLM Stats的追蹤數據,2026年第一季度共記錄255個以上的AI模型發布,主要實驗室的更新節奏壓縮至每2至3週一次。Google的Gemini 3.1 Pro以77.1%的ARC-AGI-2得分領跑16項主要基準測試,Anthropic推出Claude Opus 4.6和Sonnet 4.6,OpenAI的GPT-5.2在AIME 2025數學基準上取得滿分,阿里巴巴Qwen3-Max-Thinking躋身前沿行列。