LLM

Google發布Gemini 3.1 Flash-Lite:速度提升2.5倍,每百萬Token僅0.25美元

Google推出以效率為核心的Gemini 3.1 Flash-Lite,延遲比前代降低60%,輸出速度提升45%,定價僅為每百萬輸入Token 0.25美元。此舉反映業界從追求極致性能轉向讓更多企業負擔得起前沿AI算力的趨勢。

Google今日正式發布Gemini 3.1 Flash-Lite,這款以「效率優先」為設計哲學的語言模型,在性能與成本之間找到了一個令業界矚目的平衡點。

核心性能數字

與前代Gemini版本相比,Gemini 3.1 Flash-Lite帶來了顯著提升:

指標提升幅度
首個Token延遲(TTFT)降低約60%(響應速度快2.5倍)
輸出生成速度提升45%
輸入Token定價每百萬Token僅0.25美元

對於需要大量調用API的應用場景——如客服機器人、即時內容生成、大規模文件分析——這樣的性能與成本組合具有極高的商業吸引力。

為新創企業與中型企業而生

Google表示,Gemini 3.1 Flash-Lite的主要目標受眾是新創企業和中型企業。此前,這些組織往往因為頂尖AI模型的高昂成本而望而卻步,或者不得不在成本與性能之間做出取捨。

Flash-Lite的發布反映了一個清晰的行業趨勢:隨著AI基礎設施成本持續下降,主流AI公司開始競相提供「更便宜、更快、夠用」的模型,而不只是「最強大但最昂貴」的旗艦模型。

競爭格局影響

此次發布勢必加劇AI API市場的競爭。目前,Anthropic的Claude Haiku系列和OpenAI的GPT-4o-mini都是主打效率的輕量級模型。Gemini 3.1 Flash-Lite的加入,讓企業用戶在選擇「高效低成本」模型時,擁有了更多可以比較的選項。

對於台灣及香港的開發者和企業而言,這意味著以極低的成本,即可將谷歌最新的語言理解與生成能力整合至自家產品,加速AI應用的落地進程。