DeepSeek V4终于来了，我们知道些什么？

日期：2026-04-24 20:53:07 / 人气：45

万众期待的DeepSeek V4预览版终于在北京时间4月24日上午发布了。此前，媒体和分析师曾反复预测V4即将发布，且多次预测失败，这一次终于尘埃落定。由于模型发布时间尚短，第三方和客户评测仍在紧锣密鼓地进行中，目前可获取的有效信息相对有限。不过，通过官方技术文档和海外AI社区的初步讨论，我们仍能梳理出一些关键情报，读懂这款新模型的核心亮点与潜在影响。
一、核心战略：聚焦Agent能力提升，对标行业潮流
DeepSeek V4的核心战略方向是大幅提升Agent能力，这与OpenClaw发布以来全球大模型的发展潮流高度契合。此前，“全民养龙虾”的浪潮为MiniMax、Kimi、智谱等国产大模型厂商带来了巨大的Token增量，但其中最核心、最专业的增量却被Claude收入囊中。众所周知，Agent能力与编程能力密不可分，而Claude Code至今仍是全球最强大的AI编程工具（没有之一），即便GPT-Codex也难以撼动其地位。

DeepSeek官方公告在开篇最显眼的位置便宣称“Agent能力大幅提高”，但也坦诚“（据评测反馈）仍与Opus 4.6思考模式存在一定差距”。海外AI社区中，有部分用户兴奋地期待DeepSeek V4能成为“Claude杀手”——公允而言，这更多是一种美好愿望，背后藏着不少人对Claude及其开发商Anthropic的不满，甚至有“天下苦Anthropic久矣”的呼声。
从目前的初步测试数据来看，DeepSeek V4的Token性价比优势显著，但Agent Benchmark指标并未超过Claude Opus-4.6和GPT-5.4。需要注意的是，Benchmark分数仅具有参考意义，实际用户体验才是关键：Claude在许多Benchmark测试中并不优于GPT和Gemini，却在Agent领域几乎一枝独秀。因此，接下来一段时间，专业用户使用DeepSeek V4进行Agent操作的实际反馈，将成为衡量其能力的核心依据。
此外，DeepSeek V4将上下文窗口扩展到1M，这是一项重要提升，结合其较低的Token定价，有望大幅提升生产力。不过，这一优势的实际效果，仍需等待专业客户执行复杂任务后的反馈，预计还需两三天才能有初步结论。
关于V4推迟发布的原因，笔者有一个个人猜测：此前有传闻称其将在1月、2月发布，最终推迟至4月，大概率是为了打磨Agent能力——毕竟“龙虾”这波增量超出了所有人的预期。与其发布一个无法适配现实Agentic Workflow需求的模型，不如多花几个月时间，推出一款真正符合市场需求的产品。当然，这一猜测目前尚无实证支撑。
二、用户反馈：非核心场景体验偏“干”，或与幻觉率优化相关
从最初一波海外客户的使用反馈来看，DeepSeek V4在执行“非深度推理、非数学、非代码”类任务（如头脑风暴、文艺创作）时，给人的感受偏“太干”（dry）、“过于正式”，不仅落后于Claude和GPT的最新版本，甚至有用户认为其体验不及GPT-5.2。
需要强调的是，这些零碎的主观感受并不能代表模型的整体实力，且文艺创作本就不是DeepSeek V4的主要发力方向。但不可忽视的是，这种体验差距有可能对消费端用户的选择产生微妙影响，进而扰动当前互联网大厂在C端AI应用市场的竞争格局。
对于这种“太干”“过于正式”的体验，笔者推测，这或许是DeepSeek为解决V3/R1版本幻觉率较高问题而做出的妥协——自由发挥往往会导致幻觉率上升，而限制幻觉率则大概率会让回答变得更严谨、更“干”。当然，这一猜测仍需更多、更广泛的测试结果来验证。
三、核心悬念：训练硬件成谜，与华为、英伟达的关联尚无实证
这是很多人最关心的问题：DeepSeek V4的技术文件披露了不少训练细节，但唯独没有明确训练所使用的硬件（显卡）。整份技术文件中，仅提到“华为”（Huawei）1次，提到“英伟达”（Nvidia）3次（不含脚注），提到“GPU”14次（不含脚注），但均未明确具体型号。唯一的例外是一句“ We validated the fine-grained EP scheme on both NVIDIA GPUs and Huawei NPUs platforms”，但这仅表示测试环境，并不代表训练场景（注：这也是唯一一次提到华为昇腾NPU）。
因此，我们目前仍无法确定DeepSeek V4究竟是在什么硬件上训练而成的。技术文件中多次提到CUDA，但这也不能直接推断其完全基于英伟达架构。至于是否如部分分析师预期的那样，“基于英伟达和华为昇腾混合架构进行训练”，或是“在后训练环节对昇腾进行了专门优化”，DeepSeek官方既未认可，也未否认。相比之下，V3的技术文件在开篇就明确说明是由英伟达H800和A100训练而成。
有观点根据DeepSeek公告中“预计下半年昇腾950超节点批量上市后，Pro的价格会大幅下调”，得出“V4针对昇腾做了深度优化”“推迟发布是为了适配昇腾”的结论。这种推断虽不能完全排除，但过于跳跃：这只能说明DeepSeek官方会采购或租用一批昇腾算力，并对昇腾推理进行过一些常规优化，至于优化程度有多深、是否为了适配昇腾而推迟发布，目前均无任何实证支持。
不过，要间接证明或证伪这一猜测并不难。由于DeepSeek V4是开源模型，从发布之日起，将会有无数厂商用自己的算力运行推理。若其确实基于昇腾训练，或为昇腾做过深度优化，那么可以推断：它在昇腾硬件上的推理效率，应该高于或至少不低于在英伟达等其他硬件上的效率；或者，昇腾硬件能让V4实现其他硬件无法达到的独特性能。后续只需关注相关新闻，便能轻松了解实际情况（若没有相关新闻，则可间接证伪上述猜测）。
四、产业影响：腾讯成最大期待者，或将重塑国产大模型格局
DeepSeek V4的发布，除了其自身的突破，也将对国内AI产业界产生重要影响。其中，最期待V4发布并能“震惊世界”的，大概率是腾讯。就在V4发布前一天，腾讯混元3.0大模型预览版刚刚亮相，但其光芒很快就被DeepSeek V4完全掩盖。笔者目前尚未有机会全面试用混元3.0，但结合此前腾讯在基座大模型领域的落后态势来看，想用一个版本就跻身世界先进水平，难度极大。
因此，腾讯要做好AI生意——无论是To B领域的MaaS（模型即服务）生意（尤其是Token售卖），还是To C端的AI应用，恐怕仍需依赖高质量的第三方开源大模型。国内目前水平最高、使用人数最多的开源大模型是阿里的Qwen，作为老对手，腾讯显然不愿轻易采用。如此一来，DeepSeek以及几天前刚发布新版本的Kimi，就成为了腾讯的核心选择。若DeepSeek未来开放融资，腾讯大概率会不惜代价入局投资。
DeepSeek V4的成功与否，直接关系到腾讯能否争取到更多时间：一边将自己打造成“国产开源生态”的集合平台，一边全力追赶自研大模型的实力。可以说，目前最期待V4在用户测试中传来捷报的，当属腾讯的投资人和管理层。幸运的是，从最初期的反馈来看，海外社区对V4的评价偏向积极，但这还远远不够——要支撑起腾讯的期待，还需要更多“十分积极”的反馈，这恐怕还得等待一个星期才能最终确认。

作者：恒耀平台

DeepSeek V4终于来了，我们知道些什么？

新闻资讯 News

案例展示 Case

现在致电 5243865 OR 查看更多联系方式 →

现在致电 5243865 OR 查看更多联系方式 →