文章重點
- Google Chrome 146 Canary搭載WebMCP早期預覽版,讓網站向AI代理暴露結構化的可調用工具
- Microsoft同步參與標準制定,提出宣告式(Declarative)和指令式(Imperative)兩套API方案
- WebMCP被業界稱為「AI代理互動的USB-C」——一個統一的AI與網絡互動標準
- 將取代昂貴且脆弱的網頁爬蟲方式,讓AI代理能高效、可靠地與任何網站互動
AI代理的「最後一哩路」問題
AI代理技術正在飛速發展,但有一個根本性問題一直未能解決:AI代理如何與現有的數十億個網頁互動?
目前的方法主要有兩種:一是「螢幕截圖+像素識別」——讓AI看著網頁截圖,像人類一樣點擊按鈕和填寫表單;二是「網頁爬蟲」——直接解析HTML代碼來提取信息。兩種方法都有嚴重缺陷:前者緩慢且容易出錯,後者脆弱且隨時可能因網頁改版而失效。
WebMCP試圖一勞永逸地解決這個問題。
什麼是WebMCP?
WebMCP是基於Model Context Protocol(MCP)的網絡標準擴展。MCP最初由Anthropic在2024年提出,旨在為AI模型提供與外部工具和數據源互動的統一協議。WebMCP則將這個概念帶入了瀏覽器和網絡世界。
核心思路很簡單:讓網站主動聲明自己能為AI代理提供哪些「工具」。例如,一個電商網站可以聲明:「我提供搜索商品、加入購物車、下單結帳這些功能」,然後AI代理就能直接調用這些結構化接口,而不需要「看螢幕猜按鈕在哪裡」。
(Canary通道)
Chrome用戶
兩套API:宣告式與指令式
WebMCP提出了兩種API方案,分別適用於不同場景:
- 宣告式API(Declarative):網站在HTML中直接嵌入MCP工具描述,AI代理在載入網頁時就能自動發現可用工具。適合靜態功能和標準化操作。
- 指令式API(Imperative):通過JavaScript API動態註冊和管理MCP工具,適合需要根據用戶狀態或頁面上下文動態調整的複雜場景。
這種雙軌設計顯示了標準制定者的務實態度——他們知道不可能用一種方案滿足所有需求。
為什麼叫「AI代理的USB-C」?
業界觀察者將WebMCP比作USB-C,這個類比非常貼切。在USB-C出現之前,每個設備都有自己的充電接口(Lightning、Micro USB、各種專有接口),用戶需要攜帶多條線纜。USB-C統一了這一切。
WebMCP試圖在AI代理與網絡的互動中扮演同樣的角色。目前,每個AI代理都需要為每個網站開發專門的爬蟲或集成方案。WebMCP將提供一個統一標準,讓任何AI代理都能與任何支援WebMCP的網站無縫互動。
Google與Microsoft的罕見合作
值得注意的是,Google和Microsoft在WebMCP標準上進行了合作。這兩家在搜索和瀏覽器市場上激烈競爭的公司,在AI代理標準上選擇了合作而非對抗。這反映出雙方都認識到:一個統一的標準比各自為政更有利於整個生態系統。
對網站開發者的影響
如果WebMCP成為主流標準,網站開發者將面臨一個新的現實:他們不僅需要為人類用戶設計網頁,還需要為AI代理設計「工具接口」。這將催生一系列新需求:
- 工具描述設計:如何清晰、準確地向AI代理描述網站功能?
- 安全控制:如何確保AI代理只能執行授權操作?
- 費率限制:如何防止AI代理過度使用網站資源?
- 商業模式:當AI代理替代人類用戶直接與網站互動時,廣告模式還能運作嗎?
對AI產業的深遠影響
WebMCP的出現可能從根本上改變AI代理的能力上限。目前,AI代理在與網絡互動時最大的瓶頸不是模型能力,而是缺乏可靠的互動方式。WebMCP解決了這個瓶頸,意味著:
- AI代理將能更可靠地完成網絡購物、預訂、搜索等任務。
- 企業內部系統可以通過WebMCP向AI代理暴露功能,加速企業自動化。
- 新一代「AI原生」網站可能會優先為AI代理設計,人類界面反而成為次要。
挑戰與疑慮
WebMCP也面臨著不少挑戰。首先是採用率問題——一個標準只有在被廣泛採用時才有價值,而說服數百萬個網站添加WebMCP支援需要時間。其次是安全風險——為AI代理提供直接的功能調用接口,可能被惡意AI濫用。最後是商業影響——如果AI代理繞過了傳統的網頁瀏覽流程,那麼依賴頁面瀏覽和廣告的商業模式將面臨根本性挑戰。
結語:為AI代理鋪設的「數位公路」
如果說當年的HTTP協議為人類瀏覽網絡鋪設了基礎,那麼WebMCP可能成為AI代理與網絡互動的基礎協議。它不僅僅是一個技術標準,更代表了互聯網從「為人類設計」向「為人類和AI共同設計」的根本轉變。
目前WebMCP仍處於早期預覽階段,距離大規模採用還有很長的路。但方向已經明確:未來的互聯網將同時服務人類用戶和AI代理,而WebMCP是這個未來的第一塊基石。