Modal Labs估值衝向25億美元:AI推理基礎設施成創投新戰場

文章重點

  • Modal Labs正洽談以25億美元估值進行新一輪融資,較上輪11億翻倍
  • AI推理賽道全面爆發:Baseten 50億、Fireworks AI 40億、Inferact 8億估值
  • 推理佔AI總運算量90%以上,成本優化成為企業部署的關鍵瓶頸
  • General Catalyst有望領投,Modal Labs年化營收約5,000萬美元

推理基礎設施的爆發時刻

2月11日,TechCrunch報導AI推理基礎設施新創Modal Labs正在與創投洽談新一輪融資,估值約25億美元。如果成功,這將較數月前B輪的11億美元估值翻倍以上,反映了投資者對AI推理基礎設施的狂熱追捧。

Modal Labs由前Spotify和Better.com技術主管Erik Bernhardsson於2021年創立,專注於優化AI推理——即運行已訓練好的AI模型來回應用戶請求的過程。在AI產業中,推理佔總運算量的90%以上,而且隨著AI應用的規模擴大,推理需求正以指數級增長。

$25億 Modal Labs目標估值
$50億 Baseten估值
$40億 Fireworks AI估值
90%+ 推理佔AI運算比例

推理賽道的全面爆發

Modal Labs並非孤例。整個AI推理基礎設施賽道正在經歷一場融資狂潮:

  • Baseten:上週宣布3億美元融資,估值50億美元,較數月前的21億估值翻倍以上
  • Fireworks AI:推理雲服務商,去年10月以40億估值獲得2.5億美元融資
  • Inferact:由開源推理項目vLLM團隊創立的新創,以8億估值獲得1.5億美元種子輪融資,由a16z領投
  • RadixArk:SGLang團隊商業化,以4億估值獲得Accel領投的種子輪

短短數月內,推理賽道的總融資金額已達到數十億美元級別。

為什麼推理如此重要

對於不熟悉AI技術棧的讀者,理解推理的重要性需要幾個關鍵背景:

  • 訓練是一次性的,推理是持續的:訓練一個AI模型可能需要數月,但一旦完成,推理是每次用戶使用時都需要執行的過程
  • 成本結構不同:隨著AI應用規模擴大,推理成本將成為企業AI預算的主要組成部分
  • 延遲至關重要:對於即時對話、自動駕駛、交易系統等場景,推理速度直接影響用戶體驗和業務價值
  • 效率空間巨大:通過軟體優化,同樣的GPU硬體可以實現數倍的推理效能提升

開源與商業的碰撞

有趣的是,這一波推理新創的爆發與開源社區有著密切的關聯。vLLM(現Inferact)和SGLang(現RadixArk)都是從學術研究和開源項目中孵化出來的。當這些項目證明了其技術價值後,創投資金迅速跟進,將其商業化。

這種「開源驗證→商業化」的路徑正在成為AI基礎設施領域的常見模式。但它也帶來了一個問題:當核心技術是開源的,商業壁壘在哪裡?

企業採用的推動力

推理基礎設施投資的根本驅動力來自企業市場:

  • 越來越多的企業將AI從實驗階段推進到生產部署
  • 生產環境中的推理成本和可靠性成為首要考量
  • 企業需要在成本、延遲和品質之間找到最佳平衡
  • 多模型和多代理架構增加了推理管理的複雜性

結語:AI的「水電煤」

如果說大型語言模型是AI時代的「應用」,那麼推理基礎設施就是AI時代的「水電煤」。Modal Labs等公司正在建設的,不是最耀眼的AI產品,而是讓所有AI產品得以運行的底層基礎設施。歷史告訴我們,在每一次技術革命中,基礎設施的建設者往往比應用開發者獲得更持久的回報。