AI搜索引擎DeepSeek公布三大优化技术线%！

DeepSeek | 2025-04-23 11:58

　　DeepSeek是MoE模型，MoE（Mixture of Experts，专家混合）的核心思想就是把模型拆分成多个“专家”（Experts），每个专家都是一个独立的神经网络模块。

　　大规模并行系统比一体机负载，因为大规模EP需要在多个GPU之间传输数据，这会带来很大的通信开销，如果处理不好，就会导致计算等待数据通信，影响整体效率。

　　在DeepSeek-V3/R1这种大规模并行的推理系统中，如果某个GPU计算或通信负担过重，其他GPU划水，就会造成性能瓶颈，导致整个系统变慢，无法充分利用资源。

　　介绍完这些技术细节后，DeepSeek还介绍了在线推理服务的很多个细节，每个H800 GPU节点每秒支持73.7K和14.8k的输入输出Token，说明吞吐性能很高。