AT&T以小型語言模型削減90% AI成本：每日80億Token的企業AI革命

文章重點

AT&T首席數據官透露，透過將AI架構從大型前沿模型轉向小型語言模型（SLM）和多代理堆棧，成功將AI運營成本削減90%
重構後的系統每日處理80億個Token，覆蓋客戶服務、網絡優化、詐騙檢測等核心業務場景
AT&T的多代理架構讓專用小模型各司其職，透過協調層統一調度，取代「一個大模型處理所有任務」的傳統方式
這一案例成為企業AI從「追逐最大模型」轉向「務實優化部署」的標誌性轉折點
對香港電訊和企業市場而言，AT&T模式提供了在有限預算內實現大規模AI部署的可複製路徑

一、一個改變遊戲規則的數字：90%

在AI行業集體為萬億級投資和千億參數模型而狂歡的2026年初，AT&T首席數據官在一次技術峰會上平靜地投下了一枚震撼彈：透過將AI基礎架構從依賴大型前沿模型全面轉向小型語言模型和多代理堆棧架構，AT&T成功將AI運營成本削減了90%——而這一切並未犧牲業務效果，系統每日處理的Token數量維持在80億的驚人規模。

這個數字之所以具有劃時代意義，不僅在於其絕對幅度——90%的成本降低在任何行業都是顛覆性的——更在於它來自一家年收入超過1200億美元、擁有超過1億客戶的電信巨頭。AT&T不是一家實驗室裡的初創公司在白板上畫理論模型，它是在真實的、大規模的業務場景中驗證了這一方法論。

二、小型語言模型的崛起：為什麼「小」反而更好

理解AT&T的轉型，首先需要理解一個逐漸形成的共識：對於企業級應用而言，更大的模型不一定意味着更好的結果。前沿模型在通用能力和推理深度方面具有優勢，但企業的大多數AI任務——分類、摘要、實體提取、簡單問答——並不需要這種程度的「智慧」。用一個1.5萬億參數的模型來回答「我的賬單什麼時候到期」，就像用法拉利來送外賣：技術上可行，但經濟上荒謬。

AT&T的做法是為不同的業務場景選擇「剛好足夠」的模型。客戶服務中的常見問題由10億參數級別的專用模型處理；網絡異常檢測使用經過電信領域數據微調的30億參數模型；而只有涉及複雜推理的少量請求才會被升級到更大的模型。如果80%的請求可以用成本僅為前沿模型1/50的小模型處理，那麼整體成本的大幅下降就是自然結果。

三、多代理架構：從「超級英雄」到「特種部隊」

AT&T的核心創新在於多代理堆棧的設計——一種讓多個專用AI代理協同工作的系統架構。傳統AI部署依賴一個「全能型」大模型處理所有請求；AT&T的新架構則更像一支特種部隊：每個代理都有明確的專長，由一個輕量級的協調層統一調度。

具體而言，AT&T的多代理系統包含數十個專用代理：負責客戶意圖識別的「分類代理」、負責技術問題診斷的「故障排查代理」、負責賬單查詢的「賬務代理」。每個代理使用經過特定領域微調的小型模型，在其專長範圍內的表現往往優於通用大模型。

這種架構的另一個關鍵優勢是彈性和可維護性。當業務需求變化時，AT&T可以單獨更新某個代理，而無需重新部署整個系統。

90%

AI運營成本削減幅度

80億

每日處理Token數量

1/50

SLM vs 前沿模型成本比

1億+

AT&T服務的客戶數量

四、80億Token的規模意味着什麼

每日80億Token大約等同於處理4000萬份標準商業文件，或進行數百萬次有意義的對話交互。AT&T在如此龐大的規模上實現90%的成本削減，證明了小型語言模型在「大規模+低延遲+低成本」三角中的可行性。

更重要的是，這個規模消除了一種常見的質疑：小模型是否只適合「玩具級」的應用場景？AT&T的案例明確回答了這個問題——在經過精心的架構設計和領域微調之後，小模型完全能夠支撐電信行業中最核心的業務流程。而且由於小模型推理速度更快，AT&T的系統在響應延遲方面甚至優於之前的版本。

五、行業影響：企業AI的「去魅化」時刻

AT&T的案例代表了企業AI部署的關鍵轉折點——從「追逐最新最大模型」到「務實優化投資回報」的範式轉移。在過去兩年中，企業AI市場被「軍備競賽」心態驅動，但也讓許多企業陷入了「AI投入高但ROI低」的困境。

當一家財富500強企業公開宣稱用小模型可以節省90%成本而不犧牲業務效果時，這對每一位正在審批AI預算的CFO都是強有力的信號。這對前沿模型提供商的商業模式提出了直接挑戰——OpenAI和Anthropic或許需要提供從輕量到重量的完整模型家族，以滿足企業不同場景的需求。

「我們不再問『哪個模型最聰明』，而是問『哪個模型在這個特定任務上最具成本效益』。答案往往令人驚訝——一個經過精心微調的30億參數模型，在90%的客戶服務場景中，表現不遜於千億參數的通用模型。」——AT&T首席數據官

六、香港企業的啟示：以小搏大的AI策略

AT&T的案例對香港企業市場具有特殊的參考價值。香港超過98%的商業機構屬於中小企業，對AI充滿興趣但受限於預算。AT&T的模式表明，有效的企業AI部署不一定需要巨額投資和頂級前沿模型——精心設計的小模型架構可能是更務實的選擇。

對於香港的電訊業、銀行業和零售業而言，AT&T的多代理架構提供了可複製的框架。以客戶服務為例，為高頻低複雜度的請求部署微調過的小模型，只在涉及複雜場景時才調用更大的模型，在成本和效果之間可以達到最佳平衡。

七、技術路線圖：小模型的未來方向

AT&T的成功是企業AI領域更廣泛趨勢的縮影。Microsoft的Phi系列、Google的Gemma系列、以及開源社區中Mistral、Qwen的小型變體都在瞄準企業級「效率至上」的需求。展望2026年下半年，企業AI的關鍵戰場將從「誰的模型最大」轉向「誰的模型最高效」。

這不意味着前沿模型會失去價值——它們在創意生成、複雜推理等領域仍然無可替代——但企業AI的日常工作負載，將越來越多地由「小而美」的專用模型承擔。AT&T用事實證明了這條路的可行性，其他企業只需要跟隨這條已被驗證的路徑。

AT&T 小型語言模型企業AI AI成本優化多代理架構 SLM AI部署香港企業