AI搜索引擎外界热议DeepSeek低调“上新” V4与R2猜想再起

  DeepSeek     |      2025-04-20 11:54

  DeepSeek是一款基于AI技术的智能搜索引擎,结合深度学习与自然语言处理,提供精准、高效的搜索体验。探索DeepSeek,感受未来智能搜索的无限可能!

AI搜索引擎外界热议DeepSeek低调“上新” V4与R2猜想再起

  中国人工智能初创公司深度求索(DeepSeek)24日深夜低调上线了DeepSeek-V3的新版本DeepSeek-V3-0324,参数量为6850亿。新版本在代码、数学、推理等多个方面的能力显著提升,甚至代码能力追平美国Anthropic公司大模型Claude 3.7。外界对DeepSeek-V3-0324的关注不仅在于其性能提升,还猜测这是否意味着更新一代的V4与R2大模型即将发布。

  关于DeepSeek-V3新版本的能力提升,DeepSeek表示,新版本代码能力显著提升,接近Claude 3.7水平。例如,有用户在实测中发现,V3-0324能一次性生成800行无错误的网页代码,并实现动态响应式布局和交互效果。此外,新版本的数学与逻辑推理能力也有所增强,如经典的“4升水壶问题”和数学竞赛题,部分表现接近专业推理模型。V3-0324采用MIT许可证,允许自由修改、分发及商业化应用,进一步降低了开发者的使用门槛。

  清华大学新闻学院、人工智能学院教授沈阳认为,DeepSeek-V3-0324不仅是V3系列的一次迭代,更是中国AI技术崛起的又一力证。其在性能、效率和开源策略上的综合优势使其在全球大语言模型领域占据重要地位。未来,DeepSeek可能通过推理能力提升和多模态扩展来巩固技术领先优势,同时在中美竞争和社区生态中寻找平衡。沈阳指出,DeepSeek-V3-0324的发布看似是一次“小更新”,但其性能跳跃表明该团队可能在为后续重大版本铺路。

  路透社今年2月底引述知情人士的说法称,DeepSeek原计划在今年5月初发布R2,但现在希望尽早推出,具体时间尚未透露。此外,DeepSeek希望新模型在代码生成和多语言推理方面的表现进一步提升。不过,这些传言并未得到DeepSeek公司的证实与回应。

  沈阳表示,DeepSeek-V3-0324的推出进一步凸显中国AI企业在技术与成本上的竞争力。美国对华GPU出口限制可能促使中国企业加速国产硬件适配,同时其开源模式或引发西方厂商的连锁动作,例如推出更强闭源模型。他认为,2025年可能是中美AI竞争的分水岭。

  在OpenAI公司的GPT大模型要把通用大模型和推理大模型融合在一起的背景下,外界关注包括DeepSeek在内的中国头部大模型是否会最终出现这种合并的趋势。沈阳认为这种可能性存在,因为对于用户来说,更关心的是大模型能否给出更为智能、合理的参。

  尽管春节假期已经过半,但“来自东方的神秘力量的DeepSeek”仍在全球范围内引起热议。各路业内人士继续从不同角度分析DeepSeek的模型和技术文章。北京时间1月31日,英伟达宣布DeepSeek-R1模型登陆NVIDIA NIM

  中国人工智能初创公司深度求索(DeepSeek)于3月24日深夜低调上线了新版本DeepSeek-V3-0324,参数量达到6850亿

  2月23日,2025全球开发者先锋大会主办方确认,近期颇受关注的DeepSeek参与了今年的大会,但主要是以“闭门会议”的方式低调参会,具体场次和出席人并未对外公布

  近日,中央、国务院总理李强主持了一场专家、企业家和教科文卫体等领域代表的座谈会。来自广东湛江的AI初创公司深度求索(DeepSeek)创始人梁文锋出席并发言

  北京时间3月5日深夜,人工智能领域再次引起轰动。一款名为Manus的AI产品突然问世,官方称其为“首个通用AI Agent”,能够独立思考、规划并执行多种复杂任务,并直接交付完整成果

  2月5日,全球AI领域的明星企业DeepSeek因大规模高薪招聘引发热议。据报道,DeepSeek在BOSS直聘等平台发布了52个职位,包括深度学习研究员、核心系统研发工程师及资深UI设计师等,工作地点为北京或杭州