DeepSeek V4发布并开源百万字上下文实现普惠

第06版：人工智能

上一版下一版

放大+ 缩小- 默认o

DeepSeek V4发布并开源百万字上下文实现普惠

本报讯记者陈存报道：4月24日，DeepSeek V4预览版本宣布正式上线并同步开源，全系列支持100万token上下文。DeekSeek在公告中表示：“从现在开始，1M上下文将是DeepSeek所有官方服务的标配。”

根据DeepSeek的官方介绍，DeepSeek V4系列按大小分为两个版本，分别是DeepSeek-V4-Pro（总参数1.6T、激活参数49B），以及DeepSeek-V4-Flash（总参数284B、激活参数13B）。

其中，DeepSeek-V4-Pro在Agent能力、世界知识和推理性能方面均迎来了巨大提升。DeepSeek官方表示，DeepSeek-V4-Pro据评测反馈使用体验优于Sonnet 4.5，交付质量接近Opus 4.6非思考模式，但仍与Opus 4.6思考模型存在一定差距。同时，V4-Pro在世界知识测评中，大幅领先其他开源模型，仅稍逊于顶尖闭源模型Gemini-Pro-3.1。另外，在数学、STEM、竞赛型代码的测评中，V4-Pro超越当前所有已公开评测的开源模型，取得了比肩世界顶级闭源模型的优异成绩。

V4-Flash版本则主打高性价比。在Agent测评中，就执行简单任务方面与V4-Pro旗鼓相当，在世界知识储备方面略逊于Pro，推理能力与Pro接近；且由于模型参数和激活参数更小，相较之下能够提供更加快捷、经济的API服务。根据DeepSeek官方定价文档，V4-Pro每百万token输入1元（缓存命中）或12元（缓存未命中），输出24元；V4-Flash则分别为0.2元、1元、2元。

值得注意的是，此次DeepSeek-V4开创了全新的注意力机制，结合了压缩稀疏注意力（CSA）和高度压缩注意力（HCA），显著减少了计算复杂度，提升了长上下文处理的效率。具体而言，在1M token的上下文设置下，V4-Pro的单token推理FLOPs只有V3.2的27%，KV Cache只有10%；V4-Flash则分别压缩到了10%和7%。

V4技术报告中还提到，“我们在英伟达GPU和华为昇腾NPU两个平台上均验证了细粒度EP（专家并行）方案。”据悉，昇腾CANN在当天下午4点直播DeepSeek V4 在昇腾平台的首发。

日前，成立3年一直未对外融资的DeepSeek传出消息，称将首次开放外部融资。据相关人士透露，腾讯、阿里巴巴等企业正与DeepSeek洽谈相关事宜，可能把其估值推高至200亿美元以上。此次DeepSeek V4预览版的发布，或将影响其融资进程。当天，受V4版本发布作用，多支DeepSeek概念股已迎来涨停。

放大+ 缩小- 默认o

DeepSeek V4发布并开源 百万字上下文实现普惠

DeepSeek V4发布并开源百万字上下文实现普惠