首页 / 财经 / DeepSeek与北京大学联合发布DSpark论文 推理速度提升约60%至85

DeepSeek与北京大学联合发布DSpark论文 推理速度提升约60%至85

摸鱼不慌
摸鱼不慌管理员

6月27日,DeepSeek团队联合北京大学正式对外发布《DSpark》研究论文。该研究聚焦大模型推理加速领域,旨在通过算法架构优化解决现有草稿生成模式中的算力浪费问题。

底层架构与运行机制

针对并行草稿生成模式中token关联度低导致的验证拒绝率攀升现象,研究团队在底层架构上进行了重构。DSpark算法在并行的生成骨干网络中嵌入了轻量级顺序模块,构建出半自回归结构。该设计强化了相邻token之间的依赖关系,直接提升了草稿文本的整体生成质量。

动态验证与性能表现

在核心验证环节,方案部署了基于置信度的动态验证机制。系统会实时读取不同请求的成功概率与当前节点负载,自适应裁剪验证长度,以此规避无效计算的损耗。在离线基准测试中,该方法成功拉高了模型的可接受生成长度上限。

在DeepSeek-V4线上部署环境中,DSpark相较于基线模型实现约60%至85%的推理速度提升,并在高并发场景下有效遏制了吞吐量的衰减。

流程拆解与开源部署

为支持后续技术迭代,研究方已同步公开模型检查点及配套的DeepSpec训练框架。该验证流程的逻辑链条可拆解为以下环节:

  • 系统实时采集请求成功概率与当前服务器负载数据
  • 依据采集指标动态计算并调整单次验证的最大长度
  • 根据动态长度执行推理验证,拦截无效计算开销

该机制通过自适应调整验证长度削减冗余计算,直接回应了大模型实际部署中算力资源调配的效率诉求。