#DeepSeek 相關新聞

共 4 篇文章

LLM 2026年5月1日

DeepSeek-V4 開放權重並支援百萬 Token 長上下文，強化代理式工作流

DeepSeek-V4 以混合注意力與壓縮 KV cache 的設計，把長上下文帶入可用成本範圍，並釋出多個開放權重模型。

LLM 2026年4月30日

DeepSeek發布V4系列模型，主打1M上下文與更省記憶體的KV快取設計，瞄準長流程代理任務。

LLM 2026年4月3日

據悉，DeepSeek正計劃將其V4 AI模型遷移至華為芯片平台，以減少對英偉達硬件的依賴。這一轉變反映了中國在AI硬件自主化方面的戰略調整。

LLM 2026年3月27日

截至2026年3月下旬，DeepSeek V4仍未公開發布，此前流傳的匿名「獵鷹Alpha（Hunter Alpha）」模型被路透社確認實為小米的MiMo-V2-Pro。DeepSeek的沉默打破了中國AI實驗室的高頻發布節奏，業界對其是否面臨算力限制、戰略調整或技術瓶頸眾說紛紜。