KAIST Kim Jungho教授发布“AI存储大一统路线图”
“NVIDIA ‘Vera Rubin’引发的瓶颈,HBM与HBF结合是唯一解法”
“2027年HBM第一代量产后,2036年完成机架级共享内存ICMS”
应对人均100TB存储需求
以租赁而非所有为中心的“内存全租·月租”经济模型浮现
“K半导体须凭下一代封装抢占标准”

“今后用于人工智能(AI)的存储器将不再由个人拥有,而会像公寓一样,以支付全押或月租的方式租用的时代即将到来。”

3日,在首尔新闻中心举行的技术说明会上,KAIST电气及电子工程系教授 Kim Jungho 正在讲解HBF。照片由科技专栏作家 Baek Jongmin 提供

3日,在首尔新闻中心举行的技术说明会上,KAIST电气及电子工程系教授 Kim Jungho 正在讲解HBF。照片由科技专栏作家 Baek Jongmin 提供

View original image

被称为“高带宽存储器(HBM)之父”的韩国科学技术院(KAIST)电气及电子工程系教授 Kim Jungho 预告了高带宽闪存(HBF)的出现将引发的“存储器全押·月租时代”,并提出了未来10年的HBF开发路线图。Kim教授判断,在AI代理普及的2030年代中期,每个人将需要约100TB级别的海量存储,与其直接拥有硬件,不如通过AI工厂或云基础设施租用存储,将会形成一种全新的服务模式。


Kim教授在3日于首尔新闻中心举行的“HBF技术战略说明会”上指出,HBF将成为实现存储器租赁经济的核心。他关注到,英伟达(NVIDIA)近日发布的下一代图形处理器(GPU)“Rubin”和中央处理器(CPU)“Vera”大幅强化了“键值缓存(Key-Value Cache,KV Cache)”处理功能。这意味着,随着模型愈发精细,用于记忆对话语境的存储容量已经触及极限。


Kim教授将目前的HBM比作位于GPU旁边的“书架”,而将HBF比作在其背后支撑的“图书馆”。HBF是一种通过垂直堆叠NAND闪存,同时兼顾高带宽和大容量的技术。他主张,仅靠堆叠动态随机存取存储器(DRAM)的HBM,无法突破“容量之墙”,HBF是唯一的替代方案。

Kim教授还提出了延续至2036年的具体HBF路线图。该路线图并非单纯扩大存储容量,而是分5个阶段,从根本上重新设计GPU与存储器相互作用的体系结构。


到2028年(HBF1阶段),将出现以高速的GDDR7为核心、叠加以大容量HBF的“分布式推理系统”。在计算量较大的生成前阶段(Prefill),由速度更快的存储器承担;在正式的句子生成阶段(Decode),则由4TB级超大容量HBF负责,从而最大化整体效率。自2030年(HBF2阶段)起,HBM与HBF将开始在物理上与GPU直接集成,正式拉开混合存储时代的序幕。到2032年(HBF3阶段),将构建以一颗GPU为中心,8颗HBM与8颗HBF并行布置的“全方位混合架构”。此时HBM容量将增至192GB,HBF则增至4TB,从而解决超大规模模型中长期存在的瓶颈——KV缓存问题。


在路线图的最终阶段——2036年(HBF4·HBF5阶段),将引入以机架为单位的庞大共享存储池ICMS(Inference Context Memory Storage,推理上下文存储),由数据处理单元(DPU)向各GPU实时输送数百TB数据,“AI存储工厂”将得以实现。也就是说,DPU向各GPU实时供应数百TB数据的“AI存储工厂”基础设施将在这一时期落地。同时,HBM也将演进为“HBM6双塔”结构;“HBM6双塔”结构与中央处理器、图形处理器及存储器在单一基板(Base Die)上有机结合的MCC(Memory-Centric Computing,以存储为中心的计算)架构也将在这一阶段完成。


Kim教授介绍称,围绕HBF标准主导权的企业竞争已经白热化。SK海力士与闪迪(SanDisk)在去年8月签署了HBF规格标准化谅解备忘录(MOU),结成联盟,日本铠侠(Kioxia)也发布了自有原型产品,紧追其后。三星电子则凭借独步业界的V-NAND技术实力和Z-NAND解决方案,正筹备将HBM6与HBF合二为一的下一代解决方案。



Kim教授建议称:“未来AI产业成败最终取决于存储器,而在技术层面,能否在16层以上超高堆叠结构中解决信号完整性(Signal Integrity,SI)和热问题(Thermal Issue,TI),相关封装能力将成为胜负手。”


本报道由人工智能(AI)翻译技术生成。

版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。

不容错过的热点