深度求索发布全新“V4”模型

  参考消息网   2026-04-26 20:41:01

参考消息网4月26日报道 据《日本经济新闻》4月24日报道,中国人工智能(AI)初创企业深度求索公司(DeepSeek)24日宣布,已开始提供最新版AI模型“V4”。该模型是综合利用多种国产半导体技术开发而成的。据悉,V4在同时处理海量信息方面的能力大幅提升,其性能表现已达到与美国最新AI模型比肩的水平。

据推测,DeepSeek在开发V4的过程中,采用了由中国电信设备巨头华为技术公司等企业提供的国产半导体芯片。据报道,这些芯片不仅被用于执行推理任务,还在一定程度上被用于模型训练环节,而模型训练通常被视为对技术要求更高。

DeepSeek因2025年1月推出低成本、高性能的AI模型“R1”而享誉全球。若将对现有模型的迭代更新排除在外,V4是DeepSeek继R1之后推出的首款全新AI模型。

V4模型的“Pro”版本有1.6万亿个参数,这一参数是衡量AI性能的重要指标。相较于其前代版本(即2024年12月发布的V3),V4-Pro模型参数规模实现了1.4倍的增长。如果企业内部浩繁的规章制度中某一部分发生变动,该模型可以同步修订整套规章,从而确保整体内容的一致性,有效防止内部矛盾的产生。

DeepSeek发布了V4与多款美国AI模型的性能对比数据,其中包括Anthropic公司今年2月发布的“Claude Opus 4.6”模型、谷歌公司的“双子座3.1 Pro”,以及开放人工智能研究中心(OpenAI)今年3月发布的“GPT-5.4”。据DeepSeek介绍,V4模型在自主智能体功能及知识检索性能方面,已基本达到与美国AI模型同等的高度,其推理能力达到全球较高水平。

据奥地利《新闻报》网站4月24日报道,DeepSeek24日发布了其新旗舰AI模型的预览版,展示了自去年凭借其开创性平台震撼硅谷以来的最大改进。

这家中国初创企业推出了V4-Flash和V4-Pro两款模型,并公布了关于定价、参数以及最高可达38.4万个词元输出处理能力的基本信息。作为对比:GPT-4o和GPT-4o mini模型单次响应的最高输出限制为16384个词元;o1系列模型的输出能力为10万个词元,而较早期的GPT-3.5 Turbo模型最高输出仅为4096个词元。

DeepSeek在微信平台上称,V4实现了“全球领先”的长上下文能力,并提到“计算和存储成本大幅降低”。

艾媒咨询公司的创始人张毅说,如果超长上下文支持成为标配,那么长文本处理可能会从高度专业化的研究实验室进入商业主流。香港“对比法”技术市场研究公司的副总裁尼尔·沙阿也对这一观点表示赞同。他认为,这“有力地证明”DeepSeek在控制推理成本方面所具有的实力。推理成本是指运行AI模型所需的计算资源以及由此产生的费用。

另一个值得关注的方面是DeepSeek近期悄然完成的一项系统性转变:其新发布的开源模型首次采用了华为生产的处理器。据美国《信息》杂志报道,该处理器基于华为自主研发的“昇腾”架构。

这家总部位于杭州的AI初创企业在2025年发布了R1模型,引发了一场价值万亿美元的股市抛售潮。据报道,R1的性能足以媲美OpenAI等公司推出的最尖端AI系统,而其开发成本却仅为后者的零头。

几乎一夜之间,一些科技公司和投资者开始质疑斥资数十亿美元投入AI开发是否有意义。然而,自那以后此类支出再次增长,预计美国科技巨头2026年将投入约6500亿美元用于AI基础设施和数据中心建设。

据香港《南华早报》网站4月24日报道,华为公司的下一代昇腾950PR和950DT芯片预计将在年底前上市。DeepSeek24日宣布,该公司最新版V4模型的服务吞吐量问题将持续到今年下半年,即华为昇腾950超节点“批量上市”的时候。

晨星公司高级股票分析师李旭旸称,昇腾及其他国产芯片与DeepSeek V4模型的适配,反映的是中国人工智能模型公司从使用外国芯片转向使用国产替代芯片的大趋势。

除华为外,中国芯片设计企业摩尔线程和寒武纪也在24日宣布其各自的芯片完成了与V4模型的“零日”适配。

与此同时,腾讯公司成为首批在其TokenHub大模型服务平台引入V4模型的本土云服务提供商之一。该公司称其TokenHub平台由多家国产芯片制造商的芯片驱动。

李旭旸认为,这些动态预示了整个中国国产芯片供应链的光明前景。他补充说,不仅晶圆代工厂,而且本土芯片设备供应商如上海微电子和北方华创也将从中获益。

英伟达首席执行官黄仁勋上周在播客中表示,如果DeepSeek的最新型号在华为芯片上进行了优化,对美国来说将是“一个可怕的结果”。

知名人工智能博客作者西蒙·威尔森上周写道,新的DeepSeek模型是全球“大型前沿模型中最便宜的”。

在新模型的扩展技术报告中,DeepSeek表示,V4与领先的美国闭源模型相比,总体上具有竞争力,但在推理能力上“大约落后3到6个月”。(编译/马晓云、曹卫国、聂立涛)

责编:李传新

一审:李传新

二审:段涵敏

三审:杨又华

来源:参考消息网

我要问