LLM

OpenAI發布GPT-5.4:1百萬Token上下文,桌面任務自動化達人類水平

OpenAI正式發布GPT-5.4,搭載1百萬Token超長上下文視窗,並整合自主執行多步驟工作流程的能力。在模擬真實桌面生產力任務的OSWorld-V基準測試中,GPT-5.4得分75%,首次超越人類基準線72.4%,標誌著AI從對話工具向自主數位工作者的關鍵躍升。

2026年3月23日,OpenAI正式發布GPT-5.4,這是其GPT-5系列中迄今最強大的版本,帶來了兩項足以改變AI使用方式的關鍵升級。

百萬Token上下文:處理整個代碼庫不再是難題

GPT-5.4的1百萬Token上下文視窗(約等於750,000個英文單詞),意味著:

  • 可以一次性讀入並理解一個中型軟件項目的全部代碼
  • 可以處理一本完整的長篇小說或數百份法律文件
  • 可以在整個對話歷史的完整上下文中做出決策,不再受限於「記憶窗口」

對開發者和企業用戶而言,這解決了長期以來LLM在處理大型複雜任務時最主要的瓶頸之一。

OSWorld-V:首次超越人類桌面操作基準

更具突破性意義的,是GPT-5.4在OSWorld-V基準測試中的表現。這個基準專門模擬人類在真實桌面環境中執行的生產力任務——如在Excel中完成複雜數據分析、在多個應用間協調完成工作流程。

測試對象OSWorld-V得分
人類平均72.4%
GPT-5.475%
前代最佳AI~65%

這是AI首次在模擬真實工作環境的基準測試中,以可測量的方式超越一般人類。分析師將其描述為「AI從聊天工具轉型為自主數位工作者的質變時刻」。

對企業的影響

GPT-5.4的能力組合,對企業意味著一個具體的可能性:將複雜的跨應用工作流程交給AI自主完成——從資料整理、報告撰寫,到跨系統的數據同步——而無需人工干預每個步驟。

OpenAI同時提示,GPT-5.4的API定價相較前代有所調整,具體費率請參閱官方定價頁面。