AI搜索引擎DeepSeek公布三大优化技术线%!

  DeepSeek     |      2025-04-23 11:58

  DeepSeek是一款基于AI技术的智能搜索引擎,结合深度学习与自然语言处理,提供精准、高效的搜索体验。探索DeepSeek,感受未来智能搜索的无限可能!

AI搜索引擎DeepSeek公布三大优化技术线%!

  DeepSeek是MoE模型,MoE(Mixture of Experts,专家混合)的核心思想就是把模型拆分成多个“专家”(Experts),每个专家都是一个独立的神经网络模块。

  大规模并行系统比一体机负载,因为大规模EP需要在多个GPU之间传输数据,这会带来很大的通信开销,如果处理不好,就会导致计算等待数据通信,影响整体效率。

  在DeepSeek-V3/R1这种大规模并行的推理系统中,如果某个GPU计算或通信负担过重,其他GPU划水,就会造成性能瓶颈,导致整个系统变慢,无法充分利用资源。

  介绍完这些技术细节后,DeepSeek还介绍了在线推理服务的很多个细节,每个H800 GPU节点每秒支持73.7K和14.8k的输入输出Token,说明吞吐性能很高。