“HBM是AI时代的铀…韩国应凭借存储芯片引领AI”[Baek Jongmin的冲击波]

by Paek Jongmin

Published 02 May.2025 13:24(KST)

Updated 02 May.2025 14:48(KST)

open/close

“次世代HBM4，将成存储强国韩国半导体新跃升支点”
“HBM，有望实现1000层”
“与系统半导体的界限将被打破”
“三星应扩大投资，应对HBM4之后时代”
“中国软硬件理解度高，成最大风险因素”

编者按随着ChatGPT的出现，人工智能（AI）时代正式开启，可以说几乎没有投资者不知道图形处理器（GPU）和英伟达。ChatGPT和英伟达也给作为韩国经济基石的半导体产业带来了巨大变化。专注于为GPU提供高带宽内存（HBM）的SK海力士与未能及时押注该领域的三星电子，其处境改变了人们曾以为“永远不会变”的半导体产业版图。在一直努力摆脱“存储半导体中心生态”的韩国，HBM所具有的象征意义，是再次唤醒人们对存储半导体产业重要性的认识。虽然在与台湾台积电对抗的晶圆代工业务上，三星电子依然面临困难，但SK海力士通过与英伟达、台积电的联盟，成功掌握了主导权。据称，英伟达首席执行官黄仁勋曾请求SK海力士会长Chey Taewon更快地向其供应高性能HBM，这一轶事再次凸显了HBM的重要性。HBM作为解决AI运算瓶颈的核心部件迅速崛起，成为全球半导体市场的主战场。SK海力士抢占HBM市场率先腾飞，而曾经的存储霸主三星电子则沦为追赶者。同时，中国的强势追击也成为韩国半导体产业面临的另一大威胁。《亚洲经济》在上月25日举行的第21届总统选举前夕，采访了被称为“HBM之父”的韩国科学技术院（KAIST）电气及电子工程系教授Kim Jungho，听取他对韩国半导体产业前进方向以及下一届政府半导体产业未来战略的建言。

Kim Jeongho KAIST教授在上个月25日接受《亚洲经济》采访。照片由Baek Jongmin科技专栏作家提供

Kim Jungho教授预测，HBM的未来将不再局限于单纯的容量和速度竞争，而是会演化为集成运算功能的系统半导体。他提出，这将成为把韩国在存储领域拥有的压倒性优势，扩展为系统半导体竞争力，并进一步拉大与中国等后发国家差距的绝佳机会。

Kim教授表示：“从HBM4开始的存储与运算功能一体化，将成为韩国半导体产业新的腾飞点”，“国家应当集中力量，开发以存储为中心的新型计算架构。”他还强调，通过构建全球人才网络和打造专门面向AI的教育体系，培养未来人才，才是最终的竞争力。也就是说，要在以我们现有的存储技术优势为基础的前提下，提升软件和系统集成能力，在抢占AI时代‘铀’——HBM的技术竞争中取得优势地位。

Kim教授自HBM开发初期起就主导相关研究，被公认为存储半导体领域的世界级权威。他拥有物理学博士学位，凭借在计算机结构和存储系统方面的原创性研究备受瞩目，并与三星电子、SK海力士等国内主要半导体企业持续开展紧密的产学合作。

以下为与Kim教授的一问一答。

“HBM就像AI时代的‘铀’，是驱动AI这座‘核电站’运转的核心燃料。”

问：您很早就一直强调HBM的重要性，当时有什么特别的契机吗？

答：相比大家都在做的主流研究，我更偏好去探索非主流、根本性极限问题。早在20多年前，我就判断摩尔定律已接近极限，计算机运算的瓶颈将不再是CPU或逻辑电路，而会转变为存储带宽（数据往返通道的宽度），于是开始了HBM的基础研究。从2011年起，我参与HBM产品开发，此后大部分硕博研究都围绕HBM设计展开。直到现在，我们仍是全球高校中唯一专门研究HBM的实验室。

当SK海力士与英伟达启动HBM联合开发时，因研发人手不足，我们实验室也参与其中。我坚信这是决定未来20年的关键技术，因此全力投入研究。最终，随着AI时代的到来，HBM开始受到瞩目。无论是AI还是高性能计算，关键都在于快速处理数据的能力，也就是存储性能。如今我们正在开展HBM 4、5、6、7的结构研究。

Kaist教授Kim Jungho今年2月13日在江原道旌善举行的韩国半导体学术大会上获得“姜大元奖”后与弟子合影留念。“姜大元奖”是为重新审视开发出MOSFET的世界级半导体研究者已故姜大元博士的学术成就而设立的奖项。照片=Baek Jongmin Tech Specialist提供

问：政府一直鼓励企业发展系统半导体和晶圆代工。但现实却是，存储半导体反而成为辅助GPU的关键芯片。我们甚至在获取搭载自家HBM的GPU方面都遇到困难。为什么在AI时代存储半导体如此重要？这会给韩国带来怎样的机遇？

答：在AI运算，特别是大语言模型（LLM）的训练和推理过程中，必须将海量数据高速供给GPU核心，并接收处理结果。在这里，承担数据通道角色的存储带宽和容量，成为决定整体系统性能的瓶颈。再好的GPU，如果存储跟不上，也无法发挥其应有性能。

HBM正是为解决这一瓶颈而诞生的技术。通过将动态随机存取存储器（DRAM）垂直堆叠，并与GPU极近距离封装，大幅缩短了数据移动的距离和时间。我把HBM称为“AI时代的铀”，意思是它就像驱动AI这座核电站的核心燃料。

最近，用ChatGPT生成吉卜力工作室风格的个人头像很流行吧？这既需要强大的GPU，也需要海量存储。我认为，未来一旦进入AI自动生成视频的时代，存储使用量还会进一步激增。

韩国在DRAM和NAND闪存两大领域都拥有世界顶级的技术实力和产能。这种在存储领域的压倒性优势，正是AI时代韩国最强有力的武器。如何利用这一优势，将决定韩国半导体产业的未来。

利用ChatGPT生成吉卜力工作室画风的图像时，HBM也发挥作用。ChatGPT以吉卜力工作室画风绘制了Kim 教授和其弟子的形象。Kim 教授并非一味专注于半导体，他的研究室“TerraLab”所属的学生研究员还开展了对DeepSeek的分析工作。Kim 教授研究团队也在利用人工智能技术努力提升HBM设计的高度。照片由TerraLab提供

HBM的未来：向系统半导体演化

问：您认为HBM技术今后将如何发展？是否会出现超越“把DRAM堆得更高”的变化？

答：HBM会持续演进。目前已经有12层、即将出现16层的说法，我认为最终堆到1000层也不是不可能。研究方向之一，是不仅堆叠DRAM，还像写字楼旁边加建仓库那样，在DRAM旁边直接堆叠NAND闪存，以最大化容量。

更重要的变化是HBM本身将系统半导体化。从HBM4开始，会在最底层（基底芯片）中集成逻辑芯片，也就是运算功能。在把数据送往GPU之前，先在HBM内部进行部分处理（存内计算，Processing-in-Memory，PIM），或执行数据管理功能。

我提出的构想是，到HBM7左右时，在HBM下方的1～2层中直接集成CPU和GPU核心。这样一来，HBM就不再是单纯的存储，而会自身构成一个完整的计算系统，存储与系统半导体之间的边界将被打破。这正是把韩国在存储领域的优势扩展为系统竞争力的绝佳机会。

“从HBM4开始，会在存储下方集成逻辑功能；到HBM7时，将进一步整合CPU和GPU核心，使其本身成为一个完整的计算系统。”

问：在HBM市场上，目前是三星电子在追赶SK海力士。三星若想重新夺回主导权，需要做出哪些努力？尤其是在中国步步紧逼的情况下。

答：HBM4对三星来说极其重要，必须推出成功的产品。如果在这一代落后，差距可能在数年内被拉大。尤其是中国企业在DDR4等通用DRAM市场迅速提升市占率，在NAND闪存领域也快速追赶堆叠技术。

在这种情况下，如果无法在HBM这类高附加值、最尖端技术上确立压倒性领导力，整个韩国存储产业都可能受到威胁。如果三星过去是把HBM视为传统DRAM的延伸，从低成本、低功耗角度切入，那么现在必须改变思路。HBM是AI系统的核心部件，即便成本略高，也应朝着性能与可靠性最大化的方向发展。

值得庆幸的是，三星拥有决定性的优势：不仅具备世界最高水平的HBM设计与制造技术，同时还拥有最先进的晶圆代工能力。当HBM向集成运算功能的系统半导体演化时，三星是唯一一家能够自行设计HBM所需的逻辑芯片和运算核心，并将其与自家存储技术整合，再在自家晶圆厂中一站式生产的企业。

为了把这种潜力变为现实，三星需要跳出以往的成功公式，围绕HBM进行大胆的技术投资和组织文化变革。要以存储领导力为基础，明确提出向系统集成解决方案迈进的愿景，并着眼于HBM4之后的市场进行布局。

现在是时候从“为PC和服务器中的英特尔CPU提供辅助DRAM”的记忆中走出来，转向“为GPU打造HBM”。

中国的追击：用软件弥补硬件短板

问：中国半导体企业正在急速追赶我们。您认为他们的竞争力和威胁点主要来自哪里？

答：大约5年前，我去深圳华为做演讲，当时感觉整座城市都像“华为城”，年轻员工的能量和热情非常惊人，让我仿佛看到了上世纪80年代的水原三星电子。他们提问水平很高，眼神也很有神。办公室里摆着行军床，通宵加班的文化依旧存在。这些人才的努力，加上政府的全力支持，构成了中国企业的深厚实力。从韩国等地挖角人才的效果也不容忽视。

最近中国AI技术令人畏惧的一点，是他们在美国制裁导致硬件受限的情况下，正通过软件和创造性方法来弥补。例如，像DeepSeek这样的模型，会对软件进行优化，让GPU在等待数据期间执行其他运算。就像“牙齿没有就用牙床顶上”那样，用软件去填补硬件短板。

中国通过“让GPU不闲着”的方式优化软件。如果重新计算比写入存储更快，他们就选择重新计算，这同样是“牙齿没有就用牙床顶上”的思路。

从个人改造英伟达消费级GPU显存的案例也可以看出，中国在硬件理解和应用方面的能力相当高。当这种软件实力与硬件应用能力结合时，我认为就构成了中国最大的威胁因素。

GPU的局限与以存储为中心的计算

问：在AI时代，GPU的重要性日益提升，但韩国几乎没有成功开发自有GPU的消息。这个问题应如何破解？

答：并不是三星没有设计和制造GPU硬件的技术实力，我认为完全具备。真正的问题不在硬件本身，而在于软件生态。英伟达之所以能凭GPU称霸市场，是因为拥有名为CUDA的强大软件开发平台、大量库函数、支持GPU的高速网络，以及经过高度优化的数据中心运营软件栈。

光是把GPU芯片造出来，并不能就此完成AI模型的训练与服务。要把成千上万颗GPU高效连接、管理，并为开发者提供易用的软件环境，这一整套生态的构建要困难得多。

因此，相比简单地跟随英伟达造GPU，韩国更现实、更有效的替代方案，是探索以我们所擅长的存储为中心的新型计算架构，也就是开发能最大化存储带宽的新系统结构。

换言之，可以把GPU的一部分运算负担前移到存储端处理，或者尽可能减少数据移动本身。这样既能降低对既有软件生态的依赖，又能充分利用韩国在存储技术上的优势。