LLM
OpenAI發布GPT-5.4:1百萬Token上下文,桌面任務自動化達人類水平
OpenAI正式發布GPT-5.4,搭載1百萬Token超長上下文視窗,並整合自主執行多步驟工作流程的能力。在模擬真實桌面生產力任務的OSWorld-V基準測試中,GPT-5.4得分75%,首次超越人類基準線72.4%,標誌著AI從對話工具向自主數位工作者的關鍵躍升。
2026年3月23日,OpenAI正式發布GPT-5.4,這是其GPT-5系列中迄今最強大的版本,帶來了兩項足以改變AI使用方式的關鍵升級。
百萬Token上下文:處理整個代碼庫不再是難題
GPT-5.4的1百萬Token上下文視窗(約等於750,000個英文單詞),意味著:
- 可以一次性讀入並理解一個中型軟件項目的全部代碼
- 可以處理一本完整的長篇小說或數百份法律文件
- 可以在整個對話歷史的完整上下文中做出決策,不再受限於「記憶窗口」
對開發者和企業用戶而言,這解決了長期以來LLM在處理大型複雜任務時最主要的瓶頸之一。
OSWorld-V:首次超越人類桌面操作基準
更具突破性意義的,是GPT-5.4在OSWorld-V基準測試中的表現。這個基準專門模擬人類在真實桌面環境中執行的生產力任務——如在Excel中完成複雜數據分析、在多個應用間協調完成工作流程。
| 測試對象 | OSWorld-V得分 |
|---|---|
| 人類平均 | 72.4% |
| GPT-5.4 | 75% |
| 前代最佳AI | ~65% |
這是AI首次在模擬真實工作環境的基準測試中,以可測量的方式超越一般人類。分析師將其描述為「AI從聊天工具轉型為自主數位工作者的質變時刻」。
對企業的影響
GPT-5.4的能力組合,對企業意味著一個具體的可能性:將複雜的跨應用工作流程交給AI自主完成——從資料整理、報告撰寫,到跨系統的數據同步——而無需人工干預每個步驟。
OpenAI同時提示,GPT-5.4的API定價相較前代有所調整,具體費率請參閱官方定價頁面。