“AI存储器也将进入租房时代”‥HBM之父的展望

by Paek Jongmin

Published 03 Feb.2026 11:30(KST)

KAIST Kim Jungho教授发布“AI存储大一统路线图”
“NVIDIA ‘Vera Rubin’引发的瓶颈，HBM与HBF结合是唯一解法”
“2027年HBM第一代量产后，2036年完成机架级共享内存ICMS”
应对人均100TB存储需求
以租赁而非所有为中心的“内存全租·月租”经济模型浮现
“K半导体须凭下一代封装抢占标准”

“今后用于人工智能（AI）的存储器将不再由个人拥有，而会像公寓一样，以支付全押或月租的方式租用的时代即将到来。”

3日，在首尔新闻中心举行的技术说明会上，KAIST电气及电子工程系教授 Kim Jungho 正在讲解HBF。照片由科技专栏作家 Baek Jongmin 提供

被称为“高带宽存储器（HBM）之父”的韩国科学技术院（KAIST）电气及电子工程系教授 Kim Jungho 预告了高带宽闪存（HBF）的出现将引发的“存储器全押·月租时代”，并提出了未来10年的HBF开发路线图。Kim教授判断，在AI代理普及的2030年代中期，每个人将需要约100TB级别的海量存储，与其直接拥有硬件，不如通过AI工厂或云基础设施租用存储，将会形成一种全新的服务模式。

Kim教授在3日于首尔新闻中心举行的“HBF技术战略说明会”上指出，HBF将成为实现存储器租赁经济的核心。他关注到，英伟达（NVIDIA）近日发布的下一代图形处理器（GPU）“Rubin”和中央处理器（CPU）“Vera”大幅强化了“键值缓存（Key-Value Cache，KV Cache）”处理功能。这意味着，随着模型愈发精细，用于记忆对话语境的存储容量已经触及极限。

Kim教授将目前的HBM比作位于GPU旁边的“书架”，而将HBF比作在其背后支撑的“图书馆”。HBF是一种通过垂直堆叠NAND闪存，同时兼顾高带宽和大容量的技术。他主张，仅靠堆叠动态随机存取存储器（DRAM）的HBM，无法突破“容量之墙”，HBF是唯一的替代方案。

Kim教授还提出了延续至2036年的具体HBF路线图。该路线图并非单纯扩大存储容量，而是分5个阶段，从根本上重新设计GPU与存储器相互作用的体系结构。

到2028年（HBF1阶段），将出现以高速的GDDR7为核心、叠加以大容量HBF的“分布式推理系统”。在计算量较大的生成前阶段（Prefill），由速度更快的存储器承担；在正式的句子生成阶段（Decode），则由4TB级超大容量HBF负责，从而最大化整体效率。自2030年（HBF2阶段）起，HBM与HBF将开始在物理上与GPU直接集成，正式拉开混合存储时代的序幕。到2032年（HBF3阶段），将构建以一颗GPU为中心，8颗HBM与8颗HBF并行布置的“全方位混合架构”。此时HBM容量将增至192GB，HBF则增至4TB，从而解决超大规模模型中长期存在的瓶颈——KV缓存问题。

在路线图的最终阶段——2036年（HBF4·HBF5阶段），将引入以机架为单位的庞大共享存储池ICMS（Inference Context Memory Storage，推理上下文存储），由数据处理单元（DPU）向各GPU实时输送数百TB数据，“AI存储工厂”将得以实现。也就是说，DPU向各GPU实时供应数百TB数据的“AI存储工厂”基础设施将在这一时期落地。同时，HBM也将演进为“HBM6双塔”结构；“HBM6双塔”结构与中央处理器、图形处理器及存储器在单一基板（Base Die）上有机结合的MCC（Memory-Centric Computing，以存储为中心的计算）架构也将在这一阶段完成。

Kim教授介绍称，围绕HBF标准主导权的企业竞争已经白热化。SK海力士与闪迪（SanDisk）在去年8月签署了HBF规格标准化谅解备忘录（MOU），结成联盟，日本铠侠（Kioxia）也发布了自有原型产品，紧追其后。三星电子则凭借独步业界的V-NAND技术实力和Z-NAND解决方案，正筹备将HBM6与HBF合二为一的下一代解决方案。