DeepSeek人工智能DpSk最新模型硬刚o1！英伟达科学家等大佬：这才配叫OpenAI

DeepSeek | 2025-04-06 12:23

　　DeepSeek是一款基于AI技术的智能搜索引擎，结合深度学习与自然语言处理，提供精准、高效的搜索体验。探索DeepSeek，感受未来智能搜索的无限可能！1月20日，月之暗面推出多模态思考模型Kimi k1.5，DeepSeek开源R1推理模型，双双“硬刚”OpenAI。性能测试显示，这两款模型在多项测试中能与o1“叫板”。R1更是得到英伟达高级研究科学家Jim Fan等一众业界大佬的称赞。不过，R1与开源模型V3一样，面临着幻觉问题。

　　OpenAI怎么也没想到，o3还在画饼阶段，中国一夜之间就冒出来两个能和o1打对台的模型。

　　1月20日，月之暗面正式推出多模态思考模型Kimi k1.5，并首次公开该模型的训练技术报告。

　　Kimi k1.5在short-CoT（短链思考）方面达到领先水平，在其他多个测试中也大幅超越GPT-4和Claude Sonnet 3.5。在Long-CoT（长链思考）方面，该模型在多个领域的表现也与o1持平。

　　同一天，DeepSeek也正式开源R1推理模型，并发布技术报告。R1在多个基准测试中也与o1持平，并且成本只有o1的三十分之一。

　　不过，R1依然面临着开源模型V3一样的毛病。有网友向它提问“谁训练你的”时，它回答道：“我是被OpenAI开发的”。

　　月之暗面表示，这应该是全球范围内，有OpenAI之外的公司首次实现o1正式版的多模态推理性能。

　　同一天，DeepSeek也正式开源R1推理模型，允许所有人在遵循MIT License（注：被广泛使用的一种软件许可条款）的情况下，蒸馏R1训练其他模型。

　　更重要的是，R1的价格只有o1的约三十分之一，百万token输出只需16元人民币，相较而言，o1的百万token输出需要60美元（约合人民币436元）。

　　另外，R1的参数量较低，开发人员可以用相对较低的成本在本地运行模型。Exo Lab创始人Alex Cheema在家使用7个MacMini串联一个MacBook成功运行起了R1模型。他感叹道：“AGI（通用人工智能）到家了。”

　　R1的技术文档发布后，英伟达高级研究科学家Jim Fan第一时间对论文进行研究，之后发出了这样的感慨：“我们生活在这样一个时代：由非美国公司保持OpenAI最初的使命做真正开放的前沿研究、为所有人赋能。”

　　他补充道：“DeepSeek-R1不仅开源了大量模型，还泄露了所有训练秘密。他们可能是第一个显示 RL（强化学习）飞轮发挥主要作用、持续增长的OSS项目。（对AI研究的）影响不仅可以通过内部实现了ASI或草莓计划等神话名称来实现，也可以通过简单地转储原始算法和matplotlib学习曲线来产生影响。”

　　Jim Fan的每一句话都在戳喜欢搞神秘，卖期货的OpenAI的肺管子。

　　实际上，业界有这种看法的人还不少。Abacus ai的CEO Bindu Reddy评价道：“这是开源AGI的胜利，一家来自中国的小型初创公司击败了所有人”。

　　除了对OpenAI的讽刺之外，Jim Fan还深入解读了R1模型的创新之处。

　　他表示，R1模型纯粹由RL驱动，完全没有SFT（“冷启动”）。这让人想起 AlphaZero从头开始掌握围棋、将棋和国际象棋，而无需先模仿人类大师级的动作。

　　而且，R1使用由硬编码规则计算的真值奖励，避免使用任何RL容易攻击的学习奖励模型。随着训练的进行，模型的思考时间稳步增加。Jim Fan强调，这不是预先编程好的，而是一种模型自主的突发特性，并且模型也出现了自我反省和探索行为。

　　DeepSeek还使用了一种名为GRPO（组相对策略优化）的新优化方法，有效减少了内存使用。GRPO由DeepSeek于2024年2月发明。这也是为什么家用设备也能完整运行R1的原因。

　　基于此，有网友指出，鉴于Deepseek仍在使用GRPO等GPU性能较差的方法，可以推断出，该公司可能没有很多功能强大的Hopper GPU。这意味着，算力训练成本也是极低的。

　　有网友评价，这是AI的“顿悟时刻”：“R1-Zero（注：R1是R1-Zero调整后的模型）证明模型可以自我开发推理策略。举个例子：当遇到问题时，它学会了回溯并质疑其最初的假设这是一种从未明确编程的行为。”这代表着DeepSeek的新模型已经能够具有像人类一样的自主学习能力了。

　　知名AI评测员Matthew Berman表示，R1拥有他所见过的最像人类的内心独白。

　　然而，R1依然面临着开源模型V3一样的毛病。有网友向他提问谁训练你的时，它回答道：“我是被OpenAI开发的”。

　　如需转载请与《每日经济新闻》报社联系。未经《每日经济新闻》报社授权，严禁转载或镜像，违者必究。

　　特别提醒：如果我们使用了您的图片，请作者与本站联系索取稿酬。如您不希望作品出现在本站，可联系我们要求撤下您的作品。

　　五大维度评测OpenAI全新o1模型：代码编写、游戏制作等能力“惊艳”，事实性知识却“翻了车”

　　OpenAI王炸新一波：向开发者开放满血o1，测试中全面超越人类博士专家，准确率达到78.3%

　　Deepseek、Kimi争相对标“o1”，初创公司能打破“技术”和“用户”二选一魔咒吗？

　　大消息！美财长被曝受不了想辞职：“对等关税”太荒谬！巴菲特否认支持特朗普关税计划！美国面包店等老板称“成本增加，将转嫁给消费者”

　　支持特朗普关税？巴菲特紧急回应！美国加州州长：美国政府关税政策“并不代表人民意愿”

　　担心物价飙涨，美国消费者开启囤货模式！美投资人：从牙膏到肥皂，都趁早买起来！机构：美经济或陷入衰退