为什么在性能相近的情况下,DeepSeek模型的影响力比Qwen模型更大?

为什么在性能相近的情况下,DeepSeek模型的影响力比Qwen模型更大?

最新AI日报 2026-06-02 16 阅读
这个问题我琢磨了好几天,真的。因为我一开始的想法特别简单,不就是“谁跑分高谁就牛”嘛?后来发现自己太天真了,有点像当年觉得“手机像素越高拍照越好”一样,啪啪打脸。
这个问题我琢磨了好几天,真的。因为我一开始的想法特别简单,不就是“谁跑分高谁就牛”嘛?后来发现自己太天真了,有点像当年觉得“手机像素越高拍照越好”一样,啪啪打脸。

先说我自己的经历吧。去年下半年,我公司想上个内部的知识库问答系统,技术负责人让我调研一下开源模型。那时候Qwen和DeepSeek都出了新版本,性能数据我看了一圈,坦白说我根本分不出高低。MMLU、GSM8K这些榜单上,两者就差个小数点后两位,就跟两个学霸都考了99分,你非说A比B厉害,有什么意义呢?

但诡异的事情来了。我在GitHub上搜“Qwen vs DeepSeek”的讨论,发现一个让我特别困惑的现象:关于DeepSeek的帖子点赞数和评论数,几乎是Qwen的好几倍。我当时的第一反应是“DeepSeek是不是花钱买水军了?”(别笑,我真这么想的)

后来我做了个小小的尝试。我在公司内部拉了十几个人,让他们同时用两个模型做同样的事——比如总结一篇长文档、写一段代码、解释一个复杂概念。我本来想让大家评出“谁更好”,结果你猜怎么着?大家根本选不出来。性能确实差不多。

但有个细节让我记忆深刻。有个同事说:“Qwen的回答‘标准’得像教科书,DeepSeek的回复‘像个人在说话’。”我当时觉得这算什么评价?标准不好吗?

转折来了。上个月我参加了一个AI相关的线下沙龙,跟几个开源社区的贡献者聊了聊。有个在阿里工作过的哥们跟我说了一段话,让我恍然大悟。大意是:Qwen背靠阿里,一开始就走的是“正规军”路线——文档规范、发布节奏严谨、评测指标漂亮。这当然很好,但问题在于,这种“完美”反而让社区少了一种“参与感”。

反观DeepSeek,它的早期版本其实有不少“毛边”——比如中文表达有时候很别扭,代码生成偶尔会抽风。但正是这些不完美,让开发者觉得“我可以帮它改进”。有人写插件优化它的中文分词,有人做了个前端界面让它更好用,还有人专门整理“避坑指南”。这种自下而上的热情,是花钱买不来的。

我打个不太恰当的比方:Qwen像一个成绩优异但有点距离感的学霸,你尊重他但不一定想跟他交朋友;DeepSeek像一个成绩也还不错但愿意跟你一起熬夜打游戏的好哥们,你会自发地帮他在朋友圈宣传。

还有一个让我觉得特别有意思的点。有一天我在Reddit上瞎逛,看到一个外国开发者的评论,他说“DeepSeek feels like it was built by people who actually use AI every day, not by a product team following a roadmap.”(DeepSeek感觉像是每天在用AI的人做的,而不是一个照本宣科的产品团队做的)。这条评论让我想起了自己的一次失败尝试。

去年我试图给公司内部的某个流程写一个自动化脚本,用的是某个大厂的API。文档写得特别“规范”,但实际调用的时候各种坑——权限设置繁琐、限流规则模糊、错误码含义不清。我折腾了三天没搞定,最后放弃了。后来换了个小团队的方案,文档虽然简陋,但他们在GitHub issues里特别热情地回复问题,甚至有个开发者直接加我微信帮我调试。那种感觉完全不一样。

所以我现在的想法是:DeepSeek的影响力更大,本质上不是因为技术更牛(虽然确实不弱),而是因为它“更像一个活人”。它的团队更愿意跟社区“泡在一起”,它的迭代方向更接地气,它犯过的错误也成了大家津津乐道的话题。

而Qwen呢?说实话,它的技术积累可能更深厚,产品成熟度也更高。但它太“端”着了。就像一个穿西装的演讲者和一个穿T恤的朋友,后者更容易让人产生亲近感。

那我能给你什么建议呢? 如果你是个开发者或者创业者:

  • 第一,别只看榜单分数。那些数字有时候跟实际体验完全是两码事。我建议你每个模型都花一个小时去“折磨”一下——给它一些刁钻的、模糊的、甚至带点情绪的问题,看它怎么反应。这比看一百篇评测文章都有用。
  • 第二,留意社区的“噪音”。当一个模型的讨论区里充满了“我怎么让它干这个”“有没有人遇到过那个bug”“我自己写了个小工具解决了XX问题”这类帖子时,说明它在真正地“活着”。反之,如果讨论区全是“求模型下载链接”“什么时候出新版本”,那可能还差点意思。
  • 第三,别迷信大厂光环。说实话,我见过太多“大厂出品必属精品”的反例了。大厂的资源当然多,但有时候决策链条太长、风险控制太严,反而做不出那种“有趣”的产品。

哦对了,差点忘了说——我写这篇回答的时候,隔壁工位的同事凑过来看了一眼,说:“你又在给DeepSeek站台?”我笑了笑没解释。其实我想说的是:我不是在站台,我是在怀念那种“不完美但真实”的感觉。

你觉得呢?你有没有类似的经历,就是某个产品明明“指标”不是最好的,但你就是更喜欢用它?

如果你想了解更多的AI前沿消息,可以前往最新AI日报查看

相关标签

DeepSeek Qwen 通义千问 DeepSeek对比Qwen 开源大模型 大模型影响力 为什么DeepSeek更火 AI模型社区生态 开源模型选择 大模型实际体验 AI产品增长逻辑 开发者社区运营 LLM开源对比 AI工具推荐 知乎AI问答 大模型性能评测 开源社区文化 技术选型心得 AI产品经理视角 大模型用户体验 Claude 国产大模型对比 人工智能 生成式AI 开发者工具 开源精神 技术社区运营 AI创业观察 模型开源策略 大模型口碑 AI产品经理 技术选型避坑 程序员日常 AI工具使用心得 DeepSeek热度 Qwen冷门 AI开源模型推荐 大模型社区氛围 技术产品增长黑客 LLM开源生态 AI模型品牌效应 大模型用户粘性 AI产品情感连接 技术社区温度