本报讯 记者陈存报道:4月24日,DeepSeek V4预览版本宣布正式上线并同步开源,全系列支持100万token上下文。DeekSeek在公告中表示:“从现在开始,1M上下文将是DeepSeek所有官方服务的标配。”
根据DeepSeek的官方介绍,DeepSeek V4系列按大小分为两个版本,分别是DeepSeek-V4-Pro(总参数1.6T、激活参数49B),以及DeepSeek-V4-Flash(总参数284B、激活参数13B)。
其中,DeepSeek-V4-Pro在Agent能力、世界知识和推理性能方面均迎来了巨大提升。DeepSeek官方表示,DeepSeek-V4-Pro据评测反馈使用体验优于Sonnet 4.5,交付质量接近Opus 4.6非思考模式,但仍与Opus 4.6思考模型存在一定差距。同时,V4-Pro在世界知识测评中,大幅领先其他开源模型,仅稍逊于顶尖闭源模型Gemini-Pro-3.1。另外,在数学、STEM、竞赛型代码的测评中,V4-Pro超越当前所有已公开评测的开源模型,取得了比肩世界顶级闭源模型的优异成绩。
V4-Flash版本则主打高性价比。在Agent测评中,就执行简单任务方面与V4-Pro旗鼓相当,在世界知识储备方面略逊于Pro,推理能力与Pro接近;且由于模型参数和激活参数更小,相较之下能够提供更加快捷、经济的API服务。根据DeepSeek官方定价文档,V4-Pro每百万token输入1元(缓存命中)或12元(缓存未命中),输出24元;V4-Flash则分别为0.2元、1元、2元。
值得注意的是,此次DeepSeek-V4开创了全新的注意力机制,结合了压缩稀疏注意力(CSA)和高度压缩注意力(HCA),显著减少了计算复杂度,提升了长上下文处理的效率。具体而言,在1M token的上下文设置下,V4-Pro的单token推理FLOPs只有V3.2的27%,KV Cache只有10%;V4-Flash则分别压缩到了10%和7%。
V4技术报告中还提到,“我们在英伟达GPU和华为昇腾NPU两个平台上均验证了细粒度EP(专家并行)方案。”据悉,昇腾CANN在当天下午4点直播DeepSeek V4 在昇腾平台的首发。
日前,成立3年一直未对外融资的DeepSeek传出消息,称将首次开放外部融资。据相关人士透露,腾讯、阿里巴巴等企业正与DeepSeek洽谈相关事宜,可能把其估值推高至200亿美元以上。此次DeepSeek V4预览版的发布,或将影响其融资进程。当天,受V4版本发布作用,多支DeepSeek概念股已迎来涨停。
