[芯片Talk]HBM之后轮到CXL?AI内存版图扩张
三星量产 CXL 2.0 后瞄准 3.0
AI 内存遇到瓶颈 扩展方案崭露头角
半导体厂商加速推进 CXL 开发
三星电子开始大规模量产被称为“下一代高带宽存储器(HBM)”的计算快速互连(CXL)内存。随着用于人工智能(AI)训练和推理的服务器中内存瓶颈现象日益加剧,既能提升数据处理速度又能扩展系统容量的 CXL 内存,正作为下一代解决方案备受关注。
三星加快 CXL 架构 DRAM 的量产步伐
据半导体业界29日消息,三星电子近日完成了基于 CXL 2.0 的 DRAM——“CMM-D(CXL 架构 DRAM 内存模组)”向客户交付样品的工作,并已启动大规模量产。三星电子曾在去年10月于美国加利福尼亚州圣何塞举行的“OCP Global Summit 2025”上公布了从 HBM 覆盖至 CXL 的下一代 AI 内存路线图。当时,三星电子常务 Song Taeksang 表示,“今年第四季度将推出业内首款支持 CXL 3.1 标准的 CMM-D 产品”,并介绍了下一代产品“CMM-D 3.0”的主要规格。
CMM-D 是一款基于 CXL 接口的 DRAM 内存模组产品。三星电子在2021年5月业内首次开发出 CMM-D,随后于2022年5月推出采用 CXL 2.0 标准的 CMM-D 2.0。该产品提供 128GB 和 256GB 容量,带宽最高可达 36GB/s。
时隔约3年推出的 CMM-D 3.0 将支持连接性进一步增强的 CXL 3.1 标准。根据三星电子的介绍,新产品可实现最高 1TB 的大容量以及最高 72GB/s 的带宽,与前一代产品相比,容量和数据处理速度大幅提升。预计在运行超大规模 AI 模型的数据中心环境中,该产品的应用价值将大幅提高。
“内存高速公路”……降低服务器扩容负担
CXL 是一种开放式标准接口,帮助中央处理器(CPU)、图形处理器(GPU)、内存、AI 加速器等高性能计算设备实现高速、高效的数据交互。在传统服务器架构下,一旦内存容量达到上限,就必须新增整机服务器;而利用 CXL,可以像扩展外部设备那样灵活扩展内存。
业界常将 CXL 比喻为“内存高速公路”。不同的计算设备通过统一的接口共享数据,从而更高效地利用系统资源。尤其是在类似 AI 服务器这类需要处理海量数据并频繁访问内存的环境中,既有望提升性能,又可带来成本节约效果。
CXL 内存并非取代 HBM,而是发挥相互补充的作用。HBM 负责在紧邻 GPU 的区域进行超高速运算,而 CXL 内存则承担起整个系统层面的容量扩展和资源利用效率提升的职责。CXL 之所以被视为“下一代 AI 内存”,原因也正在于此。
商用化预期升温,但“降速论”同样存在
业界认为,CXL 市场正在进入全面商用化阶段。根据市场调研机构 Yole 的数据,2022年仅约 170万美元(约合23.5亿韩元)的 CXL 市场,预计到2026年将增长至 21亿美元,2028年更将跃升至约 160亿美元。
随着内存扩展需求不断增加,CXL 标准化工作也在加速推进。由英特尔主导并于2019年成立的“CXL 联盟”中,包括三星电子、SK海力士、美光、AMD 在内的全球半导体企业均参与其中。
SK海力士同样在加快 CXL DRAM 内存的开发。据悉,公司已在今年上半年完成基于 CXL 2.0 的 CMM-D 96GB 产品的客户认证,正在推进 128GB 产品的认证程序。SK海力士还在上月举行的“SK AI Summit 2025”上提出了涵盖 HBM、CXL 和内存内计算(PIM)的下一代内存战略。
三星电子、SK海力士、美光等三大内存厂商近期完成了与采用 CXL 2.0 技术的 Marvell CXL 解决方案“Structera”的 DRAM 兼容性测试,正不断扩大与全球企业的合作。
不过,关于 CXL 市场真正开启的时间点,业界也存在审慎观点。要将 CXL 技术应用于实际服务环境,必须在操作系统(OS)、框架、内存、加速器等各个层面实现整体优化。有观点认为,全面商用化时间点可能在2027年之后。
尤其是英伟达在 GPU 之间的互连上以 NVLink 为中心构建事实上的独立生态系统,这一点也被分析为对英特尔主导的 CXL 普及产生变量。国内无晶圆半导体设计企业 Fadu 的首席技术官(CTO)Nam Ihyun 近日在座谈会上表示,“我们正在对 CXL 交换机开发投资进行战略性调整”,“会在观察市场启动速度后再决定产品化时间点”。
版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。