[记者手记]“炽热的 Blackwell”即将到来…是时候审视安全问题了 View original image

“韩国在引进Blackwell之后的问题才更大,因为在数据中心中构建能让Blackwell正常运转的冷却设施方面,经验和技术积累都严重不足。”


上个月在私下场合见到的一位海外大型信息技术企业(Big Tech)高管表示,随着英伟达(NVIDIA)高性能图形处理器(GPU)Blackwell即将在韩国落地,他感到十分担忧。像Blackwell这样比现有GPU散热量更大的产品计划在今年进入韩国,但国内数据中心的冷却技术并无明显进展,关于数据中心管理的相关立法也尚不完善。


在引进GPU的同时,必须如同“针线相随”般配套跟上的,是能够安全管理数千、上万块GPU入驻的数据中心的方案。如果不能有效散热,芯片本身可能被烧毁,最糟糕的情况下甚至会导致数据中心停摆。


要消除这类担忧,首先需要完善法律制度。为防范数字灾难而制定的法案目前正搁置在国会。《关于数字灾难和故障安全管理的法案》(由Choi Hyeongdu议员提出)规定,主要运营方每年必须制定管理计划,指定负责人,并在发生灾难时,允许科学技术信息通信部部长开展调查。可以说,该法案涵盖了从“预防—准备—应对”整个数字灾难全生命周期的管理方案。


然而,该法案的审议进展迟缓。企业认为“在数字事故发生时有关义务和处罚条款过于严苛”,因此表示反对。科技业界十分清楚,要稳定运行Blackwell,必须配备利用冷却水的液体冷却装置。但液体冷却设备相比风冷式方案,安装成本要增加约40%至60%,这成为沉重负担。


各方对数字安全管理的必要性并无异议。立法讨论有必要转向以事前预防为重点,而非事后处罚。根据数据中心性能匹配相应冷却技术,并制定分阶段管理方案等切实可行的事故预防措施,也应写入法律。



如果不能安全运营人工智能技术,不仅企业经营会受到冲击,国民的日常生活也会直接受害,这一点在2022年SK C&C数据中心火灾引发的“KaKao全面瘫痪事件”中已得到验证。当时,不仅KakaoTalk即时通讯服务,连Kakao T、Kakao Pay等服务全部瘫痪,社会陷入混乱。个体经营者也因无法进行客户咨询和支付而遭遇诸多不便。在当下各大Big Tech企业纷纷声称要建设处理海量客户信息的人工智能数据中心的背景下,安全应当成为首要价值。单价高达数千万韩元一块的GPU,也只有在无风险运行的前提下,才能真正发挥其价值。


本报道由人工智能(AI)翻译技术生成。

版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。