Google發布Gemini 3.1 Flash-Lite：速度提升2.5倍，每百萬Token僅0.25美元

Google今日正式發布Gemini 3.1 Flash-Lite，這款以「效率優先」為設計哲學的語言模型，在性能與成本之間找到了一個令業界矚目的平衡點。

核心性能數字

與前代Gemini版本相比，Gemini 3.1 Flash-Lite帶來了顯著提升：

對於需要大量調用API的應用場景——如客服機器人、即時內容生成、大規模文件分析——這樣的性能與成本組合具有極高的商業吸引力。

Google表示，Gemini 3.1 Flash-Lite的主要目標受眾是新創企業和中型企業。此前，這些組織往往因為頂尖AI模型的高昂成本而望而卻步，或者不得不在成本與性能之間做出取捨。

Flash-Lite的發布反映了一個清晰的行業趨勢：隨著AI基礎設施成本持續下降，主流AI公司開始競相提供「更便宜、更快、夠用」的模型，而不只是「最強大但最昂貴」的旗艦模型。

此次發布勢必加劇AI API市場的競爭。目前，Anthropic的Claude Haiku系列和OpenAI的GPT-4o-mini都是主打效率的輕量級模型。Gemini 3.1 Flash-Lite的加入，讓企業用戶在選擇「高效低成本」模型時，擁有了更多可以比較的選項。

對於台灣及香港的開發者和企業而言，這意味著以極低的成本，即可將谷歌最新的語言理解與生成能力整合至自家產品，加速AI應用的落地進程。