• 官方微信公众号
  • 电子信息产业网
  • 微博
第01版:要闻

DeepSeek搅动全球AI风云

本报记者 宋婧

最近,中国人工智能公司深度求索(DeepSeek)一跃成为全球AI舆论场的中心。2月8日,QuestMobile发布的最新数据显示,DeepSeek的日活跃用户数已突破3000万大关,成为史上最快达成这一里程碑的应用。英伟达、ADM、微软、亚马逊、英特尔,以及华为、阿里云、百度智能云、腾讯云等国内外多家科技领先企业竞相宣布接入DeepSeek,彰显了全球科技圈对中国开源大模型技术实力的认可。

与此同时,DeepSeek的火爆也引发了全球资本市场的连锁反应,英伟达、博通等多个美国科技头部企业股价接连暴跌。市场分析人士认为,此轮美国股市震荡的核心原因是DeepSeek的最新突破,动摇了美国科技行业的地位。美国总统特朗普称,DeepSeek的出现“给美国相关产业敲响了警钟”。这家诞生于中国的AI新秀凭借一己之力搅动了全球AI风云。

业内普遍认为,在算力成本高企制约大模型落地的困局下,DeepSeek的技术创新直击行业痛点。DeepSeek-V3模型,采用混合专家模型(MoE)、FP8混合精度训练等技术手段,大幅降低了大模型训练的算力要求,提高了训练效率,在性能上与世界顶尖的闭源模型GPT-4o及Claude-3.5-Sonnet不相上下,但训练成本却仅为行业主流模型的1/10左右。DeepSeek-R1,价格为2.2美元/百万词元,而同性能OpenAI-o1的价格为60美元/百万词元,DeepSeek大概是OpenAI的1/30。1月28日凌晨,人工智能社区Hugging Face显示,DeepSeek发布的开源多模态人工智能模型Janus-Pro,拥有10亿和70亿参数规模,仅使用128颗英伟达A100进行训练1周。

从使用体验来看,以往的AI大模型都是只给出结果,但是DeepSeek会给出其思考和过程,更加可信,不论是让它写一段代码,还是进行数学运算,它会首先给出它的推理过程。比如需要先算什么,这步的步骤是什么,再算什么,这步的式子怎么列,答案是什么……这让推理逻辑变得十分清晰、有迹可循,也让AI变得更可信。

业内普遍认为,DeepSeek的成功或许代表了一种全新的发展方向——通过算法优化而非单纯依赖算力和数据量来提升模型性能。这一方向也为AI大模型产业的发展提供了新的思路。这种“低成本”标志着推理大模型调用进入平价时代,显著改善了大模型的应用成本,有望将大模型从“奢侈品”变成“日用品。

北京邮电大学人工智能学院人机交互与认知工程实验室主任刘伟介绍,DeepSeek最大的优势在于算法的改进和优化,节省了算力和数据量。以前如果说OpenAI是“大力出奇迹”,如今DeepSeek则是“小力也可以出奇迹”——小的算力用新的方法也能创造奇迹。创新工厂董事长李开复评论称:“DeepSeek证明了中国AI的‘敏捷创新’能力,也就是说,用1/10的算力实现90%的场景需求,这种工程化思维正在重塑行业价值标准。”

与此同时,DeepSeek采用开源模式,与国外大模型巨头闭源的做法不同,这一举措让全球开发者能够参与到模型的优化和应用拓展中,极大地激发了AI生态的活力,也让DeepSeek的影响力迅速扩散。“这是AI发展史上的‘安卓VS苹果’时刻。”斯坦福大学AI伦理研究员Elena Smith评论称,“OpenAI试图建立封闭生态,而中国公司正用开源和硬件适配抢夺开发者生态。”

“DeepSeek的推出促使国内外大模型企业加速创新,推动行业技术进步。同时,DeepSeek还推动技术平权,打破了大型技术公司的垄断,使得中小企业和个人开发者有机会以更低的成本部署顶级AI模型。”资深电信行业分析师马继华表示。

此外,有券商分析师指出,DeepSeek高性价比的特征,不仅冲击了美国AI大模型的垄断地位,而且明显提振了国内自主创新的信心和情绪。根据中国工业互联网研究院推出的《人工智能大模型年度发展趋势报告》,与国际顶尖大模型能力相比,2024年国内大模型的能力进步非常显著。从2023年第四季度到2025年第一季度的测评显示,国内外大模型能力差距缩小了将近75%,可以看出,DeepSeek的出现并不是所谓的“异军突起”,而是中国国内大模型整体发展的阶段性成果体现。

不仅仅是DeepSeek一家。其他中国AI模型也凭借有限资源在竞争中占据了一席之地。李开复的初创公司零一万物成立8个月就成为独角兽公司,2024年创造近1400万美元收入,其模型训练成本仅为300万美元,远低于GPT-4的8000万到1亿美元。阿里巴巴的千问也大幅降低了大型语言模型的成本。

美国南加州大学古尔德法学院法学教授Angela Zhang指出,自去年年中以来,阿里巴巴、腾讯、字节跳动等中国科技公司一直在稳扎稳打,逐步缩小与美国同行的差距,在能力上与他们匹敌,在成本效率上超越他们。“中国在效率方面的成就并非偶然。这是中国对美国及其盟友不断升级的出口限制的直接回应。”Angela Zhang认为,“美国限制中国获取先进的AI芯片,却无意中刺激了中国的创新。”

可以预见的是,由DeepSeek引发的这场“效率革命”带来的不仅是成本数字的变化,更可能催生AI落地方法论的根本性重构。在全球高墙林立的当下,中国公司能否将先发优势转化为生态霸权?OpenAI会否被迫加入参数精简竞赛?答案或许藏在下一个显卡驱动更新的代码行里。

2025-02-11 本报记者 宋婧 1 1 中国电子报 content_12806.html 1 DeepSeek搅动全球AI风云 /enpproperty-->