“HBM之父”Kim Jeongho：“TurboQuant 还不足以撼动内存需求”

by Paek Jongmin

Published 27 Mar.2026 09:26(KST)

Updated 27 Mar.2026 10:57(KST)

open/close

学界、产业界与AI企业专家评估TurboQuant影响
“软件与硬件半导体创新将持续推进”
“仍需验证……内存需求不会减少”
“有望降低AI研究成本负担”

谷歌标志。路透社联合新闻提供

尽管市场上出现了“谷歌的人工智能（AI）压缩算法‘TurboQuant’将缩小对韩国存储芯片需求”的担忧情绪并引发股市震荡，但各领域专家分析认为，存储器需求依然强劲，相反这项技术反而会为利用AI开展研究带来重大机遇。

Kaist教授 Kim Jeongho

被称为“高带宽内存（HBM）之父”的 KAIST 教授 Kim Jeongho 27日接受《亚洲经济》电话采访时，对 TurboQuant 的问世表示欢迎，但同时指出，“TurboQuant基本上还是延续了既有压缩技术或量化（quantization）方式，与它们并无本质区别”，“虽然提出了新的方向，但没有必要过度解读。”谷歌发布的 TurboQuant 是一种将AI模型的KV缓存压缩为3比特、从而把内存使用量减少至原来的1/6、并将速度提升至8倍的算法。

Kim 教授也指出了 TurboQuant 的技术局限。他表示：“在对KV缓存进行压缩并再次解压使用的过程中，必然会产生额外的时间延迟”，“在这一过程中还可能出现信号损失或幻觉等问题，因此需要进行充分验证。”

他接着表示：“当上下文（Context）长度变长，或扩展到多模态时，其有效性就难以保证”，“在真实服务环境中对其稳定性进行验证十分重要。”

对于市场影响，他也划清了界限。Kim 教授称：“这项技术不太可能强到足以撼动存储器需求结构本身”，“对包括HBM在内的高性能存储器需求造成的影响也将是有限的。”他判断，用于存储设备的NAND闪存可能会受到一定影响。

对于韩国、美国、日本股市上三星电子、SK海力士、美光、SanDisk 等存储半导体企业股价下跌，他认为只是短期事件。Kim 教授表示：“市场反应有些过于敏感”，“这与去年 DeepSeek 出现时的走势相似。”

Kim 教授还表示：“围绕AI基础设施中如何突破内存瓶颈的尝试将会持续”，“把软件算法与半导体结构相结合的创新今后仍很可能不断涌现。”

HyperExcel首席技术官 Lee Jinwon

神经网络处理器（NPU）开发商 HyperExcel 的首席技术官 Lee Jinwon 也持审慎态度。他表示：“KV压缩本身已经是研究积累相当丰富的领域，TurboQuant也可以视为既有量化技术的延伸。”他解释称：“KV缓存在生成的同时就被存储并立刻用于运算，因此在压缩和还原过程中需要额外的计算”，“如果这一过程没有做到最优化，即便内存占用减少，反而还有可能导致速度下降。”

在需求方层面，他也给出了不同于市场解读的观点。他表示：“如果内存使用量减少，反而会增加使用更长上下文的需求，随着AI应用本身的扩大，总体内存需求很可能会增加。”其含义是，随着资源利用效率提高，成本下降，最终会引发“杰文斯悖论（Jevons Paradox）”，即相关资源的总体消费量反而爆炸式增长。

必读新闻

“股票不用交税” 明年起年超250万韩元币圈收益征税…投资者强烈反对

Lee 首席技术官预计：“Agentic AI 会生成数量极其庞大的KV缓存，从这一点来看，未来存储半导体需求绝不会减少。”

BioNexus首席执行官 Kim Taehyung

在直接使用AI的研究一线，则流露出期待情绪。正在利用AI智能体开展科学研究的 BioNexus 首席执行官 Kim Taehyung 表示：“AI科学家为了阅读数十万篇论文并提出假设，需要消耗大量令牌，这一直是一种负担，因此对如何优化思路很多。针对这一点，谷歌给出了替代方案。”他指出：“在生物AI领域，需要同时阅读并关联论文、专利、组学数据和分析结果，内存效率和检索成本往往决定成败”，因此他期待 TurboQuant 能够降低生物AI开发的负担。

한글 기사 보기

本报道由人工智能(AI)翻译技术生成。