首页 / 财经 / DeepSeek与北京大学联合发布DSpark论文推理速度提升约60%至85

DeepSeek与北京大学联合发布DSpark论文推理速度提升约60%至85

摸鱼不慌管理员 2026-06-27 21:08:45

6月27日，DeepSeek团队联合北京大学正式对外发布《DSpark》研究论文。该研究聚焦大模型推理加速领域，旨在通过算法架构优化解决现有草稿生成模式中的算力浪费问题。

针对并行草稿生成模式中token关联度低导致的验证拒绝率攀升现象，研究团队在底层架构上进行了重构。DSpark算法在并行的生成骨干网络中嵌入了轻量级顺序模块，构建出半自回归结构。该设计强化了相邻token之间的依赖关系，直接提升了草稿文本的整体生成质量。

在核心验证环节，方案部署了基于置信度的动态验证机制。系统会实时读取不同请求的成功概率与当前节点负载，自适应裁剪验证长度，以此规避无效计算的损耗。在离线基准测试中，该方法成功拉高了模型的可接受生成长度上限。

在DeepSeek-V4线上部署环境中，DSpark相较于基线模型实现约60%至85%的推理速度提升，并在高并发场景下有效遏制了吞吐量的衰减。

为支持后续技术迭代，研究方已同步公开模型检查点及配套的DeepSpec训练框架。该验证流程的逻辑链条可拆解为以下环节：

该机制通过自适应调整验证长度削减冗余计算，直接回应了大模型实际部署中算力资源调配的效率诉求。

本文由摸鱼不慌发布，转载请注明出处。
文章链接：https://www.moyubuhuang.com/caijing/202606/35549.html

DeepSeek与北京大学联合发布DSpark论文 推理速度提升约60%至85