“HBM是AI时代的铀…韩国应凭借存储芯片引领AI”[Baek Jongmin的冲击波]
“次世代HBM4,将成存储强国韩国半导体新跃升支点”
“HBM,有望实现1000层”
“与系统半导体的界限将被打破”
“三星应扩大投资,应对HBM4之后时代”
“中国软硬件理解度高,成最大风险因素”
Kim Jungho教授预测,HBM的未来将不再局限于单纯的容量和速度竞争,而是会演化为集成运算功能的系统半导体。他提出,这将成为把韩国在存储领域拥有的压倒性优势,扩展为系统半导体竞争力,并进一步拉大与中国等后发国家差距的绝佳机会。
Kim教授表示:“从HBM4开始的存储与运算功能一体化,将成为韩国半导体产业新的腾飞点”,“国家应当集中力量,开发以存储为中心的新型计算架构。”他还强调,通过构建全球人才网络和打造专门面向AI的教育体系,培养未来人才,才是最终的竞争力。也就是说,要在以我们现有的存储技术优势为基础的前提下,提升软件和系统集成能力,在抢占AI时代‘铀’——HBM的技术竞争中取得优势地位。
Kim教授自HBM开发初期起就主导相关研究,被公认为存储半导体领域的世界级权威。他拥有物理学博士学位,凭借在计算机结构和存储系统方面的原创性研究备受瞩目,并与三星电子、SK海力士等国内主要半导体企业持续开展紧密的产学合作。
以下为与Kim教授的一问一答。
问:您很早就一直强调HBM的重要性,当时有什么特别的契机吗?
答:相比大家都在做的主流研究,我更偏好去探索非主流、根本性极限问题。早在20多年前,我就判断摩尔定律已接近极限,计算机运算的瓶颈将不再是CPU或逻辑电路,而会转变为存储带宽(数据往返通道的宽度),于是开始了HBM的基础研究。从2011年起,我参与HBM产品开发,此后大部分硕博研究都围绕HBM设计展开。直到现在,我们仍是全球高校中唯一专门研究HBM的实验室。
当SK海力士与英伟达启动HBM联合开发时,因研发人手不足,我们实验室也参与其中。我坚信这是决定未来20年的关键技术,因此全力投入研究。最终,随着AI时代的到来,HBM开始受到瞩目。无论是AI还是高性能计算,关键都在于快速处理数据的能力,也就是存储性能。如今我们正在开展HBM 4、5、6、7的结构研究。
Kaist教授Kim Jungho今年2月13日在江原道旌善举行的韩国半导体学术大会上获得“姜大元奖”后与弟子合影留念。“姜大元奖”是为重新审视开发出MOSFET的世界级半导体研究者已故姜大元博士的学术成就而设立的奖项。照片=Baek Jongmin Tech Specialist提供
View original image问:政府一直鼓励企业发展系统半导体和晶圆代工。但现实却是,存储半导体反而成为辅助GPU的关键芯片。我们甚至在获取搭载自家HBM的GPU方面都遇到困难。为什么在AI时代存储半导体如此重要?这会给韩国带来怎样的机遇?
答:在AI运算,特别是大语言模型(LLM)的训练和推理过程中,必须将海量数据高速供给GPU核心,并接收处理结果。在这里,承担数据通道角色的存储带宽和容量,成为决定整体系统性能的瓶颈。再好的GPU,如果存储跟不上,也无法发挥其应有性能。
HBM正是为解决这一瓶颈而诞生的技术。通过将动态随机存取存储器(DRAM)垂直堆叠,并与GPU极近距离封装,大幅缩短了数据移动的距离和时间。我把HBM称为“AI时代的铀”,意思是它就像驱动AI这座核电站的核心燃料。
最近,用ChatGPT生成吉卜力工作室风格的个人头像很流行吧?这既需要强大的GPU,也需要海量存储。我认为,未来一旦进入AI自动生成视频的时代,存储使用量还会进一步激增。
韩国在DRAM和NAND闪存两大领域都拥有世界顶级的技术实力和产能。这种在存储领域的压倒性优势,正是AI时代韩国最强有力的武器。如何利用这一优势,将决定韩国半导体产业的未来。
利用ChatGPT生成吉卜力工作室画风的图像时,HBM也发挥作用。ChatGPT以吉卜力工作室画风绘制了Kim 教授和其弟子的形象。Kim 教授并非一味专注于半导体,他的研究室“TerraLab”所属的学生研究员还开展了对DeepSeek的分析工作。Kim 教授研究团队也在利用人工智能技术努力提升HBM设计的高度。照片由TerraLab提供
View original imageHBM的未来:向系统半导体演化
问:您认为HBM技术今后将如何发展?是否会出现超越“把DRAM堆得更高”的变化?
答:HBM会持续演进。目前已经有12层、即将出现16层的说法,我认为最终堆到1000层也不是不可能。研究方向之一,是不仅堆叠DRAM,还像写字楼旁边加建仓库那样,在DRAM旁边直接堆叠NAND闪存,以最大化容量。
更重要的变化是HBM本身将系统半导体化。从HBM4开始,会在最底层(基底芯片)中集成逻辑芯片,也就是运算功能。在把数据送往GPU之前,先在HBM内部进行部分处理(存内计算,Processing-in-Memory,PIM),或执行数据管理功能。
我提出的构想是,到HBM7左右时,在HBM下方的1~2层中直接集成CPU和GPU核心。这样一来,HBM就不再是单纯的存储,而会自身构成一个完整的计算系统,存储与系统半导体之间的边界将被打破。这正是把韩国在存储领域的优势扩展为系统竞争力的绝佳机会。
问:在HBM市场上,目前是三星电子在追赶SK海力士。三星若想重新夺回主导权,需要做出哪些努力?尤其是在中国步步紧逼的情况下。
答:HBM4对三星来说极其重要,必须推出成功的产品。如果在这一代落后,差距可能在数年内被拉大。尤其是中国企业在DDR4等通用DRAM市场迅速提升市占率,在NAND闪存领域也快速追赶堆叠技术。
在这种情况下,如果无法在HBM这类高附加值、最尖端技术上确立压倒性领导力,整个韩国存储产业都可能受到威胁。如果三星过去是把HBM视为传统DRAM的延伸,从低成本、低功耗角度切入,那么现在必须改变思路。HBM是AI系统的核心部件,即便成本略高,也应朝着性能与可靠性最大化的方向发展。
值得庆幸的是,三星拥有决定性的优势:不仅具备世界最高水平的HBM设计与制造技术,同时还拥有最先进的晶圆代工能力。当HBM向集成运算功能的系统半导体演化时,三星是唯一一家能够自行设计HBM所需的逻辑芯片和运算核心,并将其与自家存储技术整合,再在自家晶圆厂中一站式生产的企业。
为了把这种潜力变为现实,三星需要跳出以往的成功公式,围绕HBM进行大胆的技术投资和组织文化变革。要以存储领导力为基础,明确提出向系统集成解决方案迈进的愿景,并着眼于HBM4之后的市场进行布局。
现在是时候从“为PC和服务器中的英特尔CPU提供辅助DRAM”的记忆中走出来,转向“为GPU打造HBM”。
中国的追击:用软件弥补硬件短板
问:中国半导体企业正在急速追赶我们。您认为他们的竞争力和威胁点主要来自哪里?
答:大约5年前,我去深圳华为做演讲,当时感觉整座城市都像“华为城”,年轻员工的能量和热情非常惊人,让我仿佛看到了上世纪80年代的水原三星电子。他们提问水平很高,眼神也很有神。办公室里摆着行军床,通宵加班的文化依旧存在。这些人才的努力,加上政府的全力支持,构成了中国企业的深厚实力。从韩国等地挖角人才的效果也不容忽视。
最近中国AI技术令人畏惧的一点,是他们在美国制裁导致硬件受限的情况下,正通过软件和创造性方法来弥补。例如,像DeepSeek这样的模型,会对软件进行优化,让GPU在等待数据期间执行其他运算。就像“牙齿没有就用牙床顶上”那样,用软件去填补硬件短板。
中国通过“让GPU不闲着”的方式优化软件。如果重新计算比写入存储更快,他们就选择重新计算,这同样是“牙齿没有就用牙床顶上”的思路。
从个人改造英伟达消费级GPU显存的案例也可以看出,中国在硬件理解和应用方面的能力相当高。当这种软件实力与硬件应用能力结合时,我认为就构成了中国最大的威胁因素。
GPU的局限与以存储为中心的计算
问:在AI时代,GPU的重要性日益提升,但韩国几乎没有成功开发自有GPU的消息。这个问题应如何破解?
答:并不是三星没有设计和制造GPU硬件的技术实力,我认为完全具备。真正的问题不在硬件本身,而在于软件生态。英伟达之所以能凭GPU称霸市场,是因为拥有名为CUDA的强大软件开发平台、大量库函数、支持GPU的高速网络,以及经过高度优化的数据中心运营软件栈。
光是把GPU芯片造出来,并不能就此完成AI模型的训练与服务。要把成千上万颗GPU高效连接、管理,并为开发者提供易用的软件环境,这一整套生态的构建要困难得多。
因此,相比简单地跟随英伟达造GPU,韩国更现实、更有效的替代方案,是探索以我们所擅长的存储为中心的新型计算架构,也就是开发能最大化存储带宽的新系统结构。
换言之,可以把GPU的一部分运算负担前移到存储端处理,或者尽可能减少数据移动本身。这样既能降低对既有软件生态的依赖,又能充分利用韩国在存储技术上的优势。
▲HBM(高带宽内存):一种通过将存储芯片垂直堆叠,实现向GPU等处理器高速供给数据的三维封装技术。
版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。