英伟达GPU超算提前锁定
学界、企业为AI研究排队
Kim Jongwon中心主任:“必须扩大公共超算中心,才能具备国际AI竞争力”

光州科学技术院(GIST)超级计算中心对于全罗南道地区乃至国内人工智能(AI)研究者而言,堪称一处“圣地”。在马路对面、与之相望的国家AI数据中心建成之前,国内学界若要使用基于英伟达图形加速器(GPU)的超级计算机开展AI研究,就必须到这里来。国家超级计算机5号机“Nurion”虽然已经成为国内公共领域性能最强的超级计算机,但由于并非AI时代所需的GPU型超级计算机,对国内AI研究人员来说,GIST的存在就如同“久旱逢甘霖”。


GIST人工智能研究生院院长 Kim Jongwon(左)22日向记者介绍“DreamAI”超级计算机。DreamAI是目前国内高校拥有的超级计算机中性能最为出众的一台。照片由GIST提供

GIST人工智能研究生院院长 Kim Jongwon(左)22日向记者介绍“DreamAI”超级计算机。DreamAI是目前国内高校拥有的超级计算机中性能最为出众的一台。照片由GIST提供

View original image

本月22日,在GIST AI研究生院院长兼超级计算中心主任 Kim Jongwon 的带领下,记者参观了位于研究生院大楼一层的超级计算机数据中心。出入口前摆放着展示中心所拥有计算机性能的宣传展板——“Dream AI”,意为“做梦的AI”。“截至2022年11月,TOP500排名第178位”。TOP500榜单是在德国超级计算大会上评定全球超级计算机性能排名,每年发布两次。Dream AI今年的排名为第275位。首次登场时其国内排名为第6位,虽然两年过去了,但在国内学界所拥有的计算机中,它的排名依然最高。


超级计算机是科学领域研究的必需品。Dream AI的整体排名看上去不算靠前,但由于搭载GPU,在支持AI运算方面具有优势。Dream AI共配置了320块英伟达A100 GPU。因此,需要GPU进行运算的研究人员至今仍纷纷前来使用。一位研究界相关人士表示:“就算想借用Dream AI,也得排很久的队”,颇感惋惜。考虑到AI时代对GPU训练、推理及加速功能的需求,Dream AI的实用价值很高。当前,Naver、Kakao、三星电子、KT等企业所配备的超级计算机无一例外都包含GPU。学界、公共研究机构和企业都在排队,希望通过Dream AI开展研究。这正是Dream AI成为公用超级计算机的原因。


介绍GIST超级计算机“DreamAI”在TOP500排行榜上名次的说明文字。照片由记者白锺民提供

介绍GIST超级计算机“DreamAI”在TOP500排行榜上名次的说明文字。照片由记者白锺民提供

View original image

Dream AI被布置在与走廊相对的独立空间内,计算节点和存储设备一字排开。站在机房里,冷风自地板下方不断吹出,直扑面门。这股冷风用来冷却计算机产生的热量,再沿着管道循环到室外进行管理。Kim院长表示,在温度和电力管理方面格外用心。由于电力问题,瞬间停电影响时有发生,此时不间断电源装置(UPS)就会启动。


Kim院长解释称:“我们也配备了监控系统,以确保能够安全管理这些计算机。”由于用于冷却计算机的风扇噪音很大,以至于很难听清Kim院长的说话声。用智能手表测量噪音,显示为82至85分贝,这一水平相当于铁路线旁地铁的噪音。如果在这样的环境中长时间工作,存在听力受损的风险。除Dream AI外,中心内还托管了企业委托的服务器和计算机。


该中心还安装了由英伟达直接制造的“DGXA100”“DGX-1V”计算机。同样配备每台8块A100 GPU的DG系列计算机,也是该中心引以为傲的资产之一。Kim院长表示:“拥有英伟达直接制造系统的单位并不多。”2019年,Kim院长还曾与英伟达和GIST签署合作业务协议(MOU)。在此基础上,GIST将与英伟达的合作延伸到了教育领域。记者在参观超级计算中心的次日(23日),英伟达专家就在GIST向GIST学生以及外部参会者传授了利用Dream AI的GPU进行深度学习模型开发的最新技术和方法论。


英伟达韩国相关负责人23日在GIST就利用GPU开展人工智能研究进行演讲。照片由GIST提供

英伟达韩国相关负责人23日在GIST就利用GPU开展人工智能研究进行演讲。照片由GIST提供

View original image

◇“靠铁锹和镐头不行……需要挖掘机级别的支持”=Kim院长为了推动AI开发,一再强调“挖掘机”论。他的逻辑是,像公用超级计算机Dream AI这样的设备必须加速普及,国内AI基础才能更加稳固。这也是他早早执着于建设GPU型超级计算机中心的原因。


Kim院长表示:“国内AI研发和服务大多依托小规模计算基础设施展开,这与世界各国竞相引进超大型超级计算机、强化AI研究的趋势并不相符。”与其在各个实验室单独安装和管理小规模计算机开展研究,不如集中力量建设高性能计算机,供大家共同使用,才能实现追赶。他打了一个比方:如果一味偏好私家车,就永远无法追上公交车级别的运力。Kim院长称:“Meta以开源形式公开的Llama 3.1,其参数规模已达4050亿个,要对这样的模型进行微调,靠小规模设备根本不现实。”


Kim院长的观点并没有错。Dream AI刚刚投入运行不久,ChatGPT便发布,生成式AI革命由此拉开序幕。此后,GPU进入“有钱也难买”的局面,连海外大型信息技术企业(Big Tech)都担心无法按时获得英伟达GPU的供应。得益于Kim院长率先部署GPU型超级计算机,GIST在科学技术信息通信部认定的10大专业超级计算机中心中,承担起“自动驾驶超高性能计算专业中心”的角色。这也与近期自动驾驶技术从依赖传感器转向依托视觉信息进行AI学习的发展趋势相契合。Kim院长指出,作为半导体生产国,韩国开发AI运算芯片固然重要,但开展能够真正利用AI的相关研究同样重要。为此,他强调AI超级计算机中心的作用至关重要。


Kim院长也有他的忧虑。超级计算中心需要进行第二阶段扩建,以填满剩余空间,但相关计划似乎将被推迟。电力始终是一个难题。目前每月电费就已达到约5000万韩元,未来无疑需要更大支出。Kim院长表示:“在没有额外支持的情况下,我们一直在运营这个中心”,并对持续扮演AI超级计算机“先遣队”的角色充满信心。



GIST校长 Lim Gicheol 也表示:“我们已承诺,将支持全南地区高校以低廉费用使用超级计算中心资源”,“GIST将积极走在前列,支持国内AI研究。”


本报道由人工智能(AI)翻译技术生成。

版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。

不容错过的热点