WebMCP誕生：Google與Microsoft聯手打造AI代理的「網頁USB-C」

文章重點

Google與Microsoft聯合發布WebMCP標準，讓網站直接向AI代理暴露可調用工具
已作為W3C社群草案發布，Chrome 146 Canary搭載預覽版
計算開銷較傳統視覺代理交互方式減少約67%
採用人機協作設計，而非全自動化架構

網頁世界的AI革命

2月10日，Google正式在Chrome 146 Canary中推出了WebMCP的早期預覽版——一個可能從根本上改變AI代理與網頁互動方式的新標準。這個由Google和Microsoft工程師聯合開發的協議，已作為W3C社群草案報告正式發布。

WebMCP的核心理念很簡單：與其讓AI代理像模擬人類一樣抓取網頁DOM、點擊按鈕和填寫表單，不如讓網站主動告訴代理「我能做什麼，以及你該怎麼調用我」。

67% 計算開銷減少

W3C 標準化組織

Chrome 146 搭載版本

2家科技巨頭聯合開發

從「抓取」到「對話」的範式轉換

當前的AI代理在瀏覽網頁時，基本上是在模擬人類操作：讀取頁面內容、尋找按鈕、嘗試理解表單欄位的含義。這種方式不僅速度慢、成本高，而且容易出錯。一個AI代理可能需要數十次瀏覽器交互才能完成一個簡單的購物操作。

WebMCP徹底顛覆了這個模式。網站可以通過兩種API將自己的功能「告知」AI代理：

聲明式API：適用於標準HTML表單。開發者只需在現有表單標記中添加工具名稱和描述，即可讓表單被代理直接調用
命令式API：通過navigator.modelContext瀏覽器API暴露複雜的JavaScript功能。例如，電商網站可以註冊一個searchProducts(query, filters)工具，代理只需一次結構化調用即可獲得JSON格式的搜尋結果

與Anthropic MCP的關係

WebMCP的名字容易讓人聯想到Anthropic的Model Context Protocol（MCP）。兩者確實有淵源——WebMCP借鑒了MCP的API設計理念和概念模型（帶有結構描述的可調用工具），但它是為瀏覽器環境專門設計的，完全在客戶端運行，且不使用MCP的JSON-RPC規範。

可以這樣理解：MCP是AI代理與後端服務溝通的協議，WebMCP是AI代理與前端網頁溝通的協議。兩者互為補充。

人機協作，而非全自動化

WebMCP的一個關鍵設計決策是明確圍繞「人在迴路」（Human-in-the-Loop）工作流設計，而非追求完全無監督的自動化。這意味著：

代理在執行敏感操作前會請求用戶確認
用戶可以隨時介入和修正代理的行為
網站可以設定哪些工具需要用戶授權才能調用

實際應用場景

Google分享了幾個典型應用場景：

旅遊預訂：代理可以搜尋航班、篩選結果、完成訂票——一次結構化調用替代數十次頁面操作
客戶服務：代理可以快速創建詳細的支援工單
電商購物：用戶可以通過AI代理更高效地搜尋商品、比較價格、下單購買

對開發者的意義

目前WebMCP可在Chrome 146 Canary中通過chrome://flags啟用「WebMCP for testing」標誌來體驗。Microsoft作為規範的共同作者，Edge瀏覽器的支援也值得期待。業界觀察者預計正式發布將在2026年中，Google Cloud Next或Google I/O大會可能成為更大規模推廣的舞台。

結語：互聯網的AI-Ready時代

WebMCP的誕生標誌著互聯網基礎架構為AI代理時代做準備的重要一步。就像HTML定義了人類如何閱讀網頁，WebMCP正在定義AI代理如何「理解」和「操作」網頁。當全球兩大瀏覽器廠商聯手推動一個標準時，它的影響力不容低估。這可能是2026年最具長期意義的技術發布之一。