LLM
DeepSeek-V4 開放權重並支援百萬 Token 長上下文,強化代理式工作流
DeepSeek-V4 以混合注意力與壓縮 KV cache 的設計,把長上下文帶入可用成本範圍,並釋出多個開放權重模型。
DeepSeek-V4 以混合注意力與壓縮 KV cache 的設計,把長上下文帶入可用成本範圍,並釋出多個開放權重模型。
據悉,DeepSeek正計劃將其V4 AI模型遷移至華為芯片平台,以減少對英偉達硬件的依賴。這一轉變反映了中國在AI硬件自主化方面的戰略調整。
截至2026年3月下旬,DeepSeek V4仍未公開發布,此前流傳的匿名「獵鷹Alpha(Hunter Alpha)」模型被路透社確認實為小米的MiMo-V2-Pro。DeepSeek的沉默打破了中國AI實驗室的高頻發布節奏,業界對其是否面臨算力限制、戰略調整或技術瓶頸眾說紛紜。