“HBM之父”Kim Jeongho:“TurboQuant 还不足以撼动内存需求”
学界、产业界与AI企业专家评估TurboQuant影响
“软件与硬件半导体创新将持续推进”
“仍需验证……内存需求不会减少”
“有望降低AI研究成本负担”
尽管市场上出现了“谷歌的人工智能(AI)压缩算法‘TurboQuant’将缩小对韩国存储芯片需求”的担忧情绪并引发股市震荡,但各领域专家分析认为,存储器需求依然强劲,相反这项技术反而会为利用AI开展研究带来重大机遇。
被称为“高带宽内存(HBM)之父”的 KAIST 教授 Kim Jeongho 27日接受《亚洲经济》电话采访时,对 TurboQuant 的问世表示欢迎,但同时指出,“TurboQuant基本上还是延续了既有压缩技术或量化(quantization)方式,与它们并无本质区别”,“虽然提出了新的方向,但没有必要过度解读。”谷歌发布的 TurboQuant 是一种将AI模型的KV缓存压缩为3比特、从而把内存使用量减少至原来的1/6、并将速度提升至8倍的算法。
Kim 教授也指出了 TurboQuant 的技术局限。他表示:“在对KV缓存进行压缩并再次解压使用的过程中,必然会产生额外的时间延迟”,“在这一过程中还可能出现信号损失或幻觉等问题,因此需要进行充分验证。”
他接着表示:“当上下文(Context)长度变长,或扩展到多模态时,其有效性就难以保证”,“在真实服务环境中对其稳定性进行验证十分重要。”
对于市场影响,他也划清了界限。Kim 教授称:“这项技术不太可能强到足以撼动存储器需求结构本身”,“对包括HBM在内的高性能存储器需求造成的影响也将是有限的。”他判断,用于存储设备的NAND闪存可能会受到一定影响。
对于韩国、美国、日本股市上三星电子、SK海力士、美光、SanDisk 等存储半导体企业股价下跌,他认为只是短期事件。Kim 教授表示:“市场反应有些过于敏感”,“这与去年 DeepSeek 出现时的走势相似。”
Kim 教授还表示:“围绕AI基础设施中如何突破内存瓶颈的尝试将会持续”,“把软件算法与半导体结构相结合的创新今后仍很可能不断涌现。”
神经网络处理器(NPU)开发商 HyperExcel 的首席技术官 Lee Jinwon 也持审慎态度。他表示:“KV压缩本身已经是研究积累相当丰富的领域,TurboQuant也可以视为既有量化技术的延伸。”他解释称:“KV缓存在生成的同时就被存储并立刻用于运算,因此在压缩和还原过程中需要额外的计算”,“如果这一过程没有做到最优化,即便内存占用减少,反而还有可能导致速度下降。”
在需求方层面,他也给出了不同于市场解读的观点。他表示:“如果内存使用量减少,反而会增加使用更长上下文的需求,随着AI应用本身的扩大,总体内存需求很可能会增加。”其含义是,随着资源利用效率提高,成本下降,最终会引发“杰文斯悖论(Jevons Paradox)”,即相关资源的总体消费量反而爆炸式增长。
Lee 首席技术官预计:“Agentic AI 会生成数量极其庞大的KV缓存,从这一点来看,未来存储半导体需求绝不会减少。”
在直接使用AI的研究一线,则流露出期待情绪。正在利用AI智能体开展科学研究的 BioNexus 首席执行官 Kim Taehyung 表示:“AI科学家为了阅读数十万篇论文并提出假设,需要消耗大量令牌,这一直是一种负担,因此对如何优化思路很多。针对这一点,谷歌给出了替代方案。”他指出:“在生物AI领域,需要同时阅读并关联论文、专利、组学数据和分析结果,内存效率和检索成本往往决定成败”,因此他期待 TurboQuant 能够降低生物AI开发的负担。
版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。