DeepSeek人工智能DpSk最新模型硬刚o1!英伟达科学家等大佬:这才配叫OpenAI

  DeepSeek     |      2025-04-06 12:23

  DeepSeek是一款基于AI技术的智能搜索引擎,结合深度学习与自然语言处理,提供精准、高效的搜索体验。探索DeepSeek,感受未来智能搜索的无限可能!1月20日,月之暗面推出多模态思考模型Kimi k1.5,DeepSeek开源R1推理模型,双双“硬刚”OpenAI。性能测试显示,这两款模型在多项测试中能与o1“叫板”。R1更是得到英伟达高级研究科学家Jim Fan等一众业界大佬的称赞。不过,R1与开源模型V3一样,面临着幻觉问题。

  OpenAI怎么也没想到,o3还在画饼阶段,中国一夜之间就冒出来两个能和o1打对台的模型。

  1月20日,月之暗面正式推出多模态思考模型Kimi k1.5,并首次公开该模型的训练技术报告。

  Kimi k1.5在short-CoT(短链思考)方面达到领先水平,在其他多个测试中也大幅超越GPT-4和Claude Sonnet 3.5。在Long-CoT(长链思考)方面,该模型在多个领域的表现也与o1持平。

  同一天,DeepSeek也正式开源R1推理模型,并发布技术报告。R1在多个基准测试中也与o1持平,并且成本只有o1的三十分之一。

  不过,R1依然面临着开源模型V3一样的毛病。有网友向它提问“谁训练你的”时,它回答道:“我是被OpenAI开发的”。

  月之暗面表示,这应该是全球范围内,有OpenAI之外的公司首次实现o1正式版的多模态推理性能。

  同一天,DeepSeek也正式开源R1推理模型,允许所有人在遵循MIT License(注:被广泛使用的一种软件许可条款)的情况下,蒸馏R1训练其他模型。

  更重要的是,R1的价格只有o1的约三十分之一,百万token输出只需16元人民币,相较而言,o1的百万token输出需要60美元(约合人民币436元)。

  另外,R1的参数量较低,开发人员可以用相对较低的成本在本地运行模型。Exo Lab创始人Alex Cheema在家使用7个MacMini串联一个MacBook成功运行起了R1模型。他感叹道:“AGI(通用人工智能)到家了。”

  R1的技术文档发布后,英伟达高级研究科学家Jim Fan第一时间对论文进行研究,之后发出了这样的感慨:“我们生活在这样一个时代:由非美国公司保持OpenAI最初的使命做真正开放的前沿研究、为所有人赋能。”

  他补充道:“DeepSeek-R1不仅开源了大量模型,还泄露了所有训练秘密。他们可能是第一个显示 RL(强化学习)飞轮发挥主要作用、持续增长的OSS项目。(对AI研究的)影响不仅可以通过内部实现了ASI或草莓计划等神话名称来实现,也可以通过简单地转储原始算法和matplotlib学习曲线来产生影响。”

  Jim Fan的每一句话都在戳喜欢搞神秘,卖期货的OpenAI的肺管子。

  实际上,业界有这种看法的人还不少。Abacus ai的CEO Bindu Reddy评价道:“这是开源AGI的胜利,一家来自中国的小型初创公司击败了所有人”。

  除了对OpenAI的讽刺之外,Jim Fan还深入解读了R1模型的创新之处。

  他表示,R1模型纯粹由RL驱动,完全没有SFT(“冷启动”)。这让人想起 AlphaZero从头开始掌握围棋、将棋和国际象棋,而无需先模仿人类大师级的动作。

  而且,R1使用由硬编码规则计算的真值奖励,避免使用任何RL容易攻击的学习奖励模型。随着训练的进行,模型的思考时间稳步增加。Jim Fan强调,这不是预先编程好的,而是一种模型自主的突发特性,并且模型也出现了自我反省和探索行为。

  DeepSeek还使用了一种名为GRPO(组相对策略优化)的新优化方法,有效减少了内存使用。GRPO由DeepSeek于2024年2月发明。这也是为什么家用设备也能完整运行R1的原因。

  基于此,有网友指出,鉴于Deepseek仍在使用GRPO等GPU性能较差的方法,可以推断出,该公司可能没有很多功能强大的Hopper GPU。这意味着,算力训练成本也是极低的。

  有网友评价,这是AI的“顿悟时刻”:“R1-Zero(注:R1是R1-Zero调整后的模型)证明模型可以自我开发推理策略。举个例子:当遇到问题时,它学会了回溯并质疑其最初的假设这是一种从未明确编程的行为。”这代表着DeepSeek的新模型已经能够具有像人类一样的自主学习能力了。

  知名AI评测员Matthew Berman表示,R1拥有他所见过的最像人类的内心独白。

  然而,R1依然面临着开源模型V3一样的毛病。有网友向他提问谁训练你的时,它回答道:“我是被OpenAI开发的”。

  如需转载请与《每日经济新闻》报社联系。未经《每日经济新闻》报社授权,严禁转载或镜像,违者必究。

  特别提醒:如果我们使用了您的图片,请作者与本站联系索取稿酬。如您不希望作品出现在本站,可联系我们要求撤下您的作品。

  五大维度评测OpenAI全新o1模型:代码编写、游戏制作等能力“惊艳”,事实性知识却“翻了车”

  OpenAI王炸新一波:向开发者开放满血o1,测试中全面超越人类博士专家 ,准确率达到78.3%

  Deepseek、Kimi争相对标“o1”,初创公司能打破“技术”和“用户”二选一魔咒吗?

  大消息!美财长被曝受不了想辞职:“对等关税”太荒谬!巴菲特否认支持特朗普关税计划!美国面包店等老板称“成本增加,将转嫁给消费者”

  支持特朗普关税?巴菲特紧急回应!美国加州州长:美国政府关税政策“并不代表人民意愿”

  担心物价飙涨,美国消费者开启囤货模式!美投资人:从牙膏到肥皂,都趁早买起来!机构:美经济或陷入衰退