文章重點
- Google與Microsoft聯合發布WebMCP標準,讓網站直接向AI代理暴露可調用工具
- 已作為W3C社群草案發布,Chrome 146 Canary搭載預覽版
- 計算開銷較傳統視覺代理交互方式減少約67%
- 採用人機協作設計,而非全自動化架構
網頁世界的AI革命
2月10日,Google正式在Chrome 146 Canary中推出了WebMCP的早期預覽版——一個可能從根本上改變AI代理與網頁互動方式的新標準。這個由Google和Microsoft工程師聯合開發的協議,已作為W3C社群草案報告正式發布。
WebMCP的核心理念很簡單:與其讓AI代理像模擬人類一樣抓取網頁DOM、點擊按鈕和填寫表單,不如讓網站主動告訴代理「我能做什麼,以及你該怎麼調用我」。
從「抓取」到「對話」的範式轉換
當前的AI代理在瀏覽網頁時,基本上是在模擬人類操作:讀取頁面內容、尋找按鈕、嘗試理解表單欄位的含義。這種方式不僅速度慢、成本高,而且容易出錯。一個AI代理可能需要數十次瀏覽器交互才能完成一個簡單的購物操作。
WebMCP徹底顛覆了這個模式。網站可以通過兩種API將自己的功能「告知」AI代理:
- 聲明式API:適用於標準HTML表單。開發者只需在現有表單標記中添加工具名稱和描述,即可讓表單被代理直接調用
- 命令式API:通過
navigator.modelContext瀏覽器API暴露複雜的JavaScript功能。例如,電商網站可以註冊一個searchProducts(query, filters)工具,代理只需一次結構化調用即可獲得JSON格式的搜尋結果
與Anthropic MCP的關係
WebMCP的名字容易讓人聯想到Anthropic的Model Context Protocol(MCP)。兩者確實有淵源——WebMCP借鑒了MCP的API設計理念和概念模型(帶有結構描述的可調用工具),但它是為瀏覽器環境專門設計的,完全在客戶端運行,且不使用MCP的JSON-RPC規範。
可以這樣理解:MCP是AI代理與後端服務溝通的協議,WebMCP是AI代理與前端網頁溝通的協議。兩者互為補充。
人機協作,而非全自動化
WebMCP的一個關鍵設計決策是明確圍繞「人在迴路」(Human-in-the-Loop)工作流設計,而非追求完全無監督的自動化。這意味著:
- 代理在執行敏感操作前會請求用戶確認
- 用戶可以隨時介入和修正代理的行為
- 網站可以設定哪些工具需要用戶授權才能調用
實際應用場景
Google分享了幾個典型應用場景:
- 旅遊預訂:代理可以搜尋航班、篩選結果、完成訂票——一次結構化調用替代數十次頁面操作
- 客戶服務:代理可以快速創建詳細的支援工單
- 電商購物:用戶可以通過AI代理更高效地搜尋商品、比較價格、下單購買
對開發者的意義
目前WebMCP可在Chrome 146 Canary中通過chrome://flags啟用「WebMCP for testing」標誌來體驗。Microsoft作為規範的共同作者,Edge瀏覽器的支援也值得期待。業界觀察者預計正式發布將在2026年中,Google Cloud Next或Google I/O大會可能成為更大規模推廣的舞台。
結語:互聯網的AI-Ready時代
WebMCP的誕生標誌著互聯網基礎架構為AI代理時代做準備的重要一步。就像HTML定義了人類如何閱讀網頁,WebMCP正在定義AI代理如何「理解」和「操作」網頁。當全球兩大瀏覽器廠商聯手推動一個標準時,它的影響力不容低估。這可能是2026年最具長期意義的技術發布之一。