为什么在性能相近的情况下，DeepSeek模型的影响力比Qwen模型更大？

最新AI日报 2026-06-02 16 阅读

这个问题我琢磨了好几天，真的。因为我一开始的想法特别简单，不就是“谁跑分高谁就牛”嘛？后来发现自己太天真了，有点像当年觉得“手机像素越高拍照越好”一样，啪啪打脸。

这个问题我琢磨了好几天，真的。因为我一开始的想法特别简单，不就是“谁跑分高谁就牛”嘛？后来发现自己太天真了，有点像当年觉得“手机像素越高拍照越好”一样，啪啪打脸。

先说我自己的经历吧。去年下半年，我公司想上个内部的知识库问答系统，技术负责人让我调研一下开源模型。那时候Qwen和DeepSeek都出了新版本，性能数据我看了一圈，坦白说我根本分不出高低。MMLU、GSM8K这些榜单上，两者就差个小数点后两位，就跟两个学霸都考了99分，你非说A比B厉害，有什么意义呢？

但诡异的事情来了。我在GitHub上搜“Qwen vs DeepSeek”的讨论，发现一个让我特别困惑的现象：关于DeepSeek的帖子点赞数和评论数，几乎是Qwen的好几倍。我当时的第一反应是“DeepSeek是不是花钱买水军了？”（别笑，我真这么想的）

后来我做了个小小的尝试。我在公司内部拉了十几个人，让他们同时用两个模型做同样的事——比如总结一篇长文档、写一段代码、解释一个复杂概念。我本来想让大家评出“谁更好”，结果你猜怎么着？大家根本选不出来。性能确实差不多。

但有个细节让我记忆深刻。有个同事说：“Qwen的回答‘标准’得像教科书，DeepSeek的回复‘像个人在说话’。”我当时觉得这算什么评价？标准不好吗？

转折来了。上个月我参加了一个AI相关的线下沙龙，跟几个开源社区的贡献者聊了聊。有个在阿里工作过的哥们跟我说了一段话，让我恍然大悟。大意是：Qwen背靠阿里，一开始就走的是“正规军”路线——文档规范、发布节奏严谨、评测指标漂亮。这当然很好，但问题在于，这种“完美”反而让社区少了一种“参与感”。

反观DeepSeek，它的早期版本其实有不少“毛边”——比如中文表达有时候很别扭，代码生成偶尔会抽风。但正是这些不完美，让开发者觉得“我可以帮它改进”。有人写插件优化它的中文分词，有人做了个前端界面让它更好用，还有人专门整理“避坑指南”。这种自下而上的热情，是花钱买不来的。

我打个不太恰当的比方：Qwen像一个成绩优异但有点距离感的学霸，你尊重他但不一定想跟他交朋友；DeepSeek像一个成绩也还不错但愿意跟你一起熬夜打游戏的好哥们，你会自发地帮他在朋友圈宣传。

还有一个让我觉得特别有意思的点。有一天我在Reddit上瞎逛，看到一个外国开发者的评论，他说“DeepSeek feels like it was built by people who actually use AI every day, not by a product team following a roadmap.”（DeepSeek感觉像是每天在用AI的人做的，而不是一个照本宣科的产品团队做的）。这条评论让我想起了自己的一次失败尝试。

去年我试图给公司内部的某个流程写一个自动化脚本，用的是某个大厂的API。文档写得特别“规范”，但实际调用的时候各种坑——权限设置繁琐、限流规则模糊、错误码含义不清。我折腾了三天没搞定，最后放弃了。后来换了个小团队的方案，文档虽然简陋，但他们在GitHub issues里特别热情地回复问题，甚至有个开发者直接加我微信帮我调试。那种感觉完全不一样。

所以我现在的想法是：DeepSeek的影响力更大，本质上不是因为技术更牛（虽然确实不弱），而是因为它“更像一个活人”。它的团队更愿意跟社区“泡在一起”，它的迭代方向更接地气，它犯过的错误也成了大家津津乐道的话题。

而Qwen呢？说实话，它的技术积累可能更深厚，产品成熟度也更高。但它太“端”着了。就像一个穿西装的演讲者和一个穿T恤的朋友，后者更容易让人产生亲近感。

那我能给你什么建议呢？如果你是个开发者或者创业者：

第一，别只看榜单分数。那些数字有时候跟实际体验完全是两码事。我建议你每个模型都花一个小时去“折磨”一下——给它一些刁钻的、模糊的、甚至带点情绪的问题，看它怎么反应。这比看一百篇评测文章都有用。
第二，留意社区的“噪音”。当一个模型的讨论区里充满了“我怎么让它干这个”“有没有人遇到过那个bug”“我自己写了个小工具解决了XX问题”这类帖子时，说明它在真正地“活着”。反之，如果讨论区全是“求模型下载链接”“什么时候出新版本”，那可能还差点意思。
第三，别迷信大厂光环。说实话，我见过太多“大厂出品必属精品”的反例了。大厂的资源当然多，但有时候决策链条太长、风险控制太严，反而做不出那种“有趣”的产品。

哦对了，差点忘了说——我写这篇回答的时候，隔壁工位的同事凑过来看了一眼，说：“你又在给DeepSeek站台？”我笑了笑没解释。其实我想说的是：我不是在站台，我是在怀念那种“不完美但真实”的感觉。

你觉得呢？你有没有类似的经历，就是某个产品明明“指标”不是最好的，但你就是更喜欢用它？

如果你想了解更多的AI前沿消息，可以前往最新AI日报查看