LLW低延迟内存方案进入行业视野 智能手机借力HBM集成思路提升端侧AI效率
端侧AI对移动设备算力与数据吞吐能力的持续提升需求,正推动智能手机内存技术进入新一轮架构探索。一种名为LLW(低延迟宽DRAM)的新型内存解决方案近期受到关注,该方案在物理集成方式上借鉴了高带宽内存(HBM)的路径,试图在手机紧凑的机身空间内改善AI运算的数据供给效率。
LLW方案的集成逻辑
LLW全称为低延迟宽DRAM,从字面看指向其两项核心特征:更低的访问延迟与更宽的数据通道。其在封装层面的实现方式,被认为吸收了HBM通过硅中介层将DRAM堆叠于逻辑芯片上方或近旁的思路,目标是在缩短数据传输物理距离的同时,扩大单位时间内的数据搬运量。
高带宽内存(HBM)是一种将多层DRAM垂直堆叠,并通过硅通孔与中介层同处理器紧密互联的内存技术,通常应用于数据中心级GPU与AI加速器。
对于智能手机而言,端侧AI模型的推理过程需要频繁读取参数与中间结果,内存带宽与响应速度直接影响着任务完成时间与功耗表现。当前已有的LPDDR系列内存在功耗控制上具备优势,但在AI场景下的低延迟、高并发访问需求面前,封装形态与数据路径的优化正成为新的突破口。
端侧算力需求驱动的内存架构调整
随着大模型小型化与端侧部署进程加快,手机芯片内部的数据流动量显著增加。原有的内存架构设计主要面向通用计算负载,其物理布局与处理器核心之间的距离限制了信号传输速率的进一步缩减。
LLW方案所代表的近存计算路径,通过将高带宽DRAM更紧密地耦合至处理器所在封装模块,降低了数据传输环节的等待时间。这种集成度的提升,意味着在同样功耗预算下,AI运算单元可获得更及时的数据补给。
从行业影响看,一旦此类内存方案进入规模化应用,终端厂商在端侧AI功能部署上将获得更高的算力利用效率。这有助于在不显著增加整机功耗的前提下,支撑更大规模参数的模型在手机端持续运行,进而推动离线语音助手、本地图像生成等场景的体验改善。

小米、华为被视作LLW内存技术潜在推动者 应用产品预计2027年下半年推进
针对智能手机端侧AI对内存性能的持续需求,一种被称为LLW的替代方案正在受到关注。来自数码博主的信息显示,国内手机厂商短期内还难以在该技术上实现大规模商用,但相关产品可能在2027年下半年取得突破,小米和华为被认为是潜在的推动者。
兼顾性能与落地可行性的过渡选择
LLW虽未达到HBM(高带宽内存)的性能等级,但通过更加紧密的集成设计,理论上可以突破传统LPDDR内存在带宽和延迟方面的局限。HBM对封装和散热的要求较高,直接应用于智能手机产品尚存障碍,这使得LLW成为一种更具落地可能性的选项。
HBM即高带宽内存,通过堆叠芯片与中介层互连实现超高传输速率,但对散热与空间占用要求更高。
目前关于LLW的性能数据主要来自网络流传的测试预期:其功耗有望降低约50%,同时带来约1.5倍的性能提升。不过,该数据的对比基准并未被明确说明,后续实际表现仍需进一步验证。
从实验室到终端的路线图
据业内人士透露,新一代内存技术在手机端的应用不会在短期内铺开。尽管产业链已看到端侧AI对内存带宽和能效的迫切需求,但封装集成、供应链成熟度等因素仍制约着落地节奏。当前的时间表指向2027年下半年,届时相关搭载LLW的产品或逐步浮出水面。
在这一赛道上,小米和华为的身影被认为最值得关注。两家厂商在芯片与系统集成领域的布局,使其具备更早介入的条件。
LLW被视为一种在性能与可量产性之间寻求平衡的方案。如果后续功耗与带宽指标能够达到设计预期,它或将成为支撑手机端侧大模型运行的重要底层技术。

手机端侧AI模型规模扩大 内存系统成体验关键环节
随着智能手机承载的端侧人工智能任务日益复杂,内存架构的优化正成为影响实际体验的重要因素。仅依靠提升处理器性能已难以匹配应用需求的变化。
端侧计算推高内存性能要求
端侧AI指在手机、平板等终端设备上直接运行的人工智能模型,无需依赖云端处理。此类模型的规模持续扩大,对设备计算资源提出更高标准。
神经网络处理单元(NPU)是专门用于加速AI运算的硬件模块,而传统路径多聚焦于提升NPU能力或更换更快的存储介质。不过,这些方式逐渐触及效能界限。
业内普遍认为,随着手机端侧AI模型规模不断扩大,仅依靠提升处理器性能已难以满足需求,内存系统正成为影响体验的重要环节。相比单纯升级NPU或存储方案,更高带宽、更低延迟的内存架构被视为未来突破方向之一。
内存带宽指内存与处理器之间单位时间的数据传输量,延迟则反映数据访问的响应速度。两者直接关系AI模型加载与运行效率,进而影响应用启动、图像识别等功能的流畅度。
这一判断反映出移动设备在AI计算演进中,对内存子系统的依赖正在增强。对手机厂商与芯片设计企业而言,在功率和空间约束下构建更高效的内存架构,或将成为产品差异化的关键节点。
