通过GPUaaS模式扩展AI基础设施服务
NAVER打造全行业AI应用生态
NAVER Cloud表示,将以人工智能(AI)基础设施为基础,率先推进订阅型图形处理器(GPU)云服务(GPUaaS)。
Naver Cloud运营总括本部长兼首席信息官 Lee Sangjun 27日在世宗市集贤洞的Naver数据中心“각 Sejong”举行的技术见面会上,介绍Naver的人工智能基础设施竞争力。Naver Cloud提供
View original imageNAVER Cloud首席运营官(CIO)Lee Sangjun 27日在世宗市集贤洞NAVER数据中心“Gak Sejong”举行的技术交流会上表示:“AI基础设施的竞争力,不仅在于能获取多少GPU,更取决于如何将已获取的资源进行稳定、高效的运营”,“我们将把积累的AI基础设施运营能力发展为GPUaaS模式,打造一个国内企业可以轻松利用AI的生态系统”。
这意味着将为AI模型训练和推理而设计的基础设施以服务形式提供。该CIO表示:“NAVER是2019年将英伟达超级计算基础设施‘SuperPod’在全球范围内最快实现商用化的企业,拥有亲自设计和运营超高性能GPU集群的经验”,“我们将以全球水准的GPU运营内化能力为基础,提高整个产业对AI的利用水平”。
他补充称:“包括GPUaaS业务在内,我们正在推进以HyperCLOVA X为基础,为各产业、各企业、各类业务打造垂直化AI模型的业务,以及开发可在企业内部实际使用的办公应用程序(App)等。”现代汽车、三星电子、韩国水力原子力公司、韩国银行等正在使用相关的NAVER服务。
对于近期与Samsung SDS组建联合体,参与国家AI计算中心建设项目一事,他表示,在风险对冲层面,公司具备竞争力。该CIO称:“我们不仅会履行好作为服务商的角色,还将利用正在成长中的大量内部AI工作负载,在无违和感的情况下完成这一任务。”
另一方面,在国家信息资源管理院火灾事件后,外界对数据中心管理的警惕性不断提高,他表示,“Gak Sejong”即使在发生故障的情况下也能不间断运行。NAVER Cloud数据中心负责人Noh Sangmin表示:“发生火灾时,我们不仅会同时运用灭火气体和喷淋系统,还在首都圈以及忠清、庆南地区运营了相当数量的租赁互联网数据中心(IDC),并持续投资,以便能够尽快完成恢复。”
通过将电力、冷却和服务器运营体系设计为双路结构,并重新配置不间断电源装置(UPS)和配电设备,从结构上切断故障的扩散,这也发挥了重要作用。比如,对主进线进行双路设计,即使一条线路出现问题,也能稳定接收电力。向机房供电的电力系统则构建为主用(Active)和备用(Standby),当所有线路都出现问题时,UPS会在15分钟内提供备用电力。在此期间,应急发电机启动,最多可提供72小时可用电力。
2023年11月投入运营的“Gak Sejong”是一座最大可利用270兆瓦受电容量的超大规模数据中心。其在传统互联网数据中心(IDC)承担的存储和处理功能基础上进一步发展,被设计为可同时进行AI训练和推理的高密度GPU运算空间。计划在2028年和2029年分别完成第二、三阶段扩建。
版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。