DeepSeek V4终于来了,我们知道些什么?
日期:2026-04-24 20:53:07 / 人气:28
万众期待的DeepSeek V4预览版终于在北京时间4月24日上午发布了。此前,媒体和分析师曾反复预测V4即将发布,且多次预测失败,这一次终于尘埃落定。由于模型发布时间尚短,第三方和客户评测仍在紧锣密鼓地进行中,目前可获取的有效信息相对有限。不过,通过官方技术文档和海外AI社区的初步讨论,我们仍能梳理出一些关键情报,读懂这款新模型的核心亮点与潜在影响。
一、核心战略:聚焦Agent能力提升,对标行业潮流
DeepSeek V4的核心战略方向是大幅提升Agent能力,这与OpenClaw发布以来全球大模型的发展潮流高度契合。此前,“全民养龙虾”的浪潮为MiniMax、Kimi、智谱等国产大模型厂商带来了巨大的Token增量,但其中最核心、最专业的增量却被Claude收入囊中。众所周知,Agent能力与编程能力密不可分,而Claude Code至今仍是全球最强大的AI编程工具(没有之一),即便GPT-Codex也难以撼动其地位。

DeepSeek官方公告在开篇最显眼的位置便宣称“Agent能力大幅提高”,但也坦诚“(据评测反馈)仍与Opus 4.6思考模式存在一定差距”。海外AI社区中,有部分用户兴奋地期待DeepSeek V4能成为“Claude杀手”——公允而言,这更多是一种美好愿望,背后藏着不少人对Claude及其开发商Anthropic的不满,甚至有“天下苦Anthropic久矣”的呼声。
从目前的初步测试数据来看,DeepSeek V4的Token性价比优势显著,但Agent Benchmark指标并未超过Claude Opus-4.6和GPT-5.4。需要注意的是,Benchmark分数仅具有参考意义,实际用户体验才是关键:Claude在许多Benchmark测试中并不优于GPT和Gemini,却在Agent领域几乎一枝独秀。因此,接下来一段时间,专业用户使用DeepSeek V4进行Agent操作的实际反馈,将成为衡量其能力的核心依据。
此外,DeepSeek V4将上下文窗口扩展到1M,这是一项重要提升,结合其较低的Token定价,有望大幅提升生产力。不过,这一优势的实际效果,仍需等待专业客户执行复杂任务后的反馈,预计还需两三天才能有初步结论。
关于V4推迟发布的原因,笔者有一个个人猜测:此前有传闻称其将在1月、2月发布,最终推迟至4月,大概率是为了打磨Agent能力——毕竟“龙虾”这波增量超出了所有人的预期。与其发布一个无法适配现实Agentic Workflow需求的模型,不如多花几个月时间,推出一款真正符合市场需求的产品。当然,这一猜测目前尚无实证支撑。
二、用户反馈:非核心场景体验偏“干”,或与幻觉率优化相关
从最初一波海外客户的使用反馈来看,DeepSeek V4在执行“非深度推理、非数学、非代码”类任务(如头脑风暴、文艺创作)时,给人的感受偏“太干”(dry)、“过于正式”,不仅落后于Claude和GPT的最新版本,甚至有用户认为其体验不及GPT-5.2。
需要强调的是,这些零碎的主观感受并不能代表模型的整体实力,且文艺创作本就不是DeepSeek V4的主要发力方向。但不可忽视的是,这种体验差距有可能对消费端用户的选择产生微妙影响,进而扰动当前互联网大厂在C端AI应用市场的竞争格局。
对于这种“太干”“过于正式”的体验,笔者推测,这或许是DeepSeek为解决V3/R1版本幻觉率较高问题而做出的妥协——自由发挥往往会导致幻觉率上升,而限制幻觉率则大概率会让回答变得更严谨、更“干”。当然,这一猜测仍需更多、更广泛的测试结果来验证。
三、核心悬念:训练硬件成谜,与华为、英伟达的关联尚无实证
这是很多人最关心的问题:DeepSeek V4的技术文件披露了不少训练细节,但唯独没有明确训练所使用的硬件(显卡)。整份技术文件中,仅提到“华为”(Huawei)1次,提到“英伟达”(Nvidia)3次(不含脚注),提到“GPU”14次(不含脚注),但均未明确具体型号。唯一的例外是一句“ We validated the fine-grained EP scheme on both NVIDIA GPUs and Huawei NPUs platforms”,但这仅表示测试环境,并不代表训练场景(注:这也是唯一一次提到华为昇腾NPU)。
因此,我们目前仍无法确定DeepSeek V4究竟是在什么硬件上训练而成的。技术文件中多次提到CUDA,但这也不能直接推断其完全基于英伟达架构。至于是否如部分分析师预期的那样,“基于英伟达和华为昇腾混合架构进行训练”,或是“在后训练环节对昇腾进行了专门优化”,DeepSeek官方既未认可,也未否认。相比之下,V3的技术文件在开篇就明确说明是由英伟达H800和A100训练而成。
有观点根据DeepSeek公告中“预计下半年昇腾950超节点批量上市后,Pro的价格会大幅下调”,得出“V4针对昇腾做了深度优化”“推迟发布是为了适配昇腾”的结论。这种推断虽不能完全排除,但过于跳跃:这只能说明DeepSeek官方会采购或租用一批昇腾算力,并对昇腾推理进行过一些常规优化,至于优化程度有多深、是否为了适配昇腾而推迟发布,目前均无任何实证支持。
不过,要间接证明或证伪这一猜测并不难。由于DeepSeek V4是开源模型,从发布之日起,将会有无数厂商用自己的算力运行推理。若其确实基于昇腾训练,或为昇腾做过深度优化,那么可以推断:它在昇腾硬件上的推理效率,应该高于或至少不低于在英伟达等其他硬件上的效率;或者,昇腾硬件能让V4实现其他硬件无法达到的独特性能。后续只需关注相关新闻,便能轻松了解实际情况(若没有相关新闻,则可间接证伪上述猜测)。
四、产业影响:腾讯成最大期待者,或将重塑国产大模型格局
DeepSeek V4的发布,除了其自身的突破,也将对国内AI产业界产生重要影响。其中,最期待V4发布并能“震惊世界”的,大概率是腾讯。就在V4发布前一天,腾讯混元3.0大模型预览版刚刚亮相,但其光芒很快就被DeepSeek V4完全掩盖。笔者目前尚未有机会全面试用混元3.0,但结合此前腾讯在基座大模型领域的落后态势来看,想用一个版本就跻身世界先进水平,难度极大。
因此,腾讯要做好AI生意——无论是To B领域的MaaS(模型即服务)生意(尤其是Token售卖),还是To C端的AI应用,恐怕仍需依赖高质量的第三方开源大模型。国内目前水平最高、使用人数最多的开源大模型是阿里的Qwen,作为老对手,腾讯显然不愿轻易采用。如此一来,DeepSeek以及几天前刚发布新版本的Kimi,就成为了腾讯的核心选择。若DeepSeek未来开放融资,腾讯大概率会不惜代价入局投资。
DeepSeek V4的成功与否,直接关系到腾讯能否争取到更多时间:一边将自己打造成“国产开源生态”的集合平台,一边全力追赶自研大模型的实力。可以说,目前最期待V4在用户测试中传来捷报的,当属腾讯的投资人和管理层。幸运的是,从最初期的反馈来看,海外社区对V4的评价偏向积极,但这还远远不够——要支撑起腾讯的期待,还需要更多“十分积极”的反馈,这恐怕还得等待一个星期才能最终确认。
作者:恒耀平台
新闻资讯 News
- 杨洋《雨霖铃》刷屏热搜!从肖奈...05-23
- 赞达亚甜蜜分享恋情日常!荷兰弟...05-23
- 《主角》最通透的人:看懂米兰的...05-23
- 全网热议!窦靖童当众喊那英“老...05-23

