实现D2C液冷系统…展示浸没式冷却模型
搭建NVIDIA B200与AI服务器机架等
构建AI专用网络和电力基础设施

KT Cloud表示,将推出融合人工智能(AI)数据中心基础设施与展厅功能的技术实证枢纽“AI创新中心”。KT Cloud计划在此对包括可快速为高发热AI芯片降温的液体冷却技术在内的AI基础设施技术进行验证并应用。


该中心构建了与真实AI数据中心相同的环境,配置了英伟达最新B200图形处理器(GPU)、AI服务器机架(Rack)、直接芯片冷却(D2C)液体冷却装置以及AI网络等。尤其集中展示了KT Cloud正在推进商用化及技术验证的各类冷却技术。


部署在KT Cloud人工智能创新中心的AI基础设施实验室。KT Cloud提供

部署在KT Cloud人工智能创新中心的AI基础设施实验室。KT Cloud提供

View original image

KT Cloud在中心内优先部署了已被全球AI服务器作为标准采用的D2C水冷系统。该技术通过在GPU芯片上附着冷却板,使冷却水直接接触芯片进行散热。KT Cloud通过该中心展示了由8个1千瓦级模块组成的服务器型水冷负载为基础的D2C水冷系统的运行场景。KT Cloud已在上月启用的加山AI数据中心中率先在国内实现该技术的商用化。


为此,公司自主开发了服务器型和机架(Rack)型负载设备,并根据B200 GPU和NVL72规格,对冷却水流量、压力、温度等条件进行实证。NVL72是指英伟达开发的高速GPU互连技术“NVLink”扩展至最多72个的方案。


中心还展示了将AI服务器直接浸没在特殊液体中进行散热的浸没式液冷技术的实物模型。KT Cloud表示,通过技术验证(PoC)开展实际负载测试后确认,该技术最高可实现约60%的电力节省效果。


此外,KT Cloud与AI网络专业企业Arista合作,在中心内部构建了基于RoCEv2(第二版融合以太网上的远程直接内存访问)的AI专用网络。该网络支持AI服务器之间的超高速数据传输,其特点是在对比传统超高速网络方式InfiniBand时,采用了提升成本效率和可扩展性的下一代以太网远程直接内存访问技术。远程直接内存访问是指在服务器间进行数据传输时,数据不经由中央处理器而由内存直接处理,从而降低时延并提升速度的技术。


在KT Cloud人工智能创新中心部署B200 GPU以推进人工智能服务。KT Cloud提供

在KT Cloud人工智能创新中心部署B200 GPU以推进人工智能服务。KT Cloud提供

View original image

KT Cloud自主开发的基于标准机架的AI电力基础设施也在中心亮相。该标准机架具备支持20千瓦以上AI服务器的高密度供电结构,并采用48伏直流(DC)电源,以强化能源效率和稳定性。通过模块化设计,扩展与更换更加便捷,同时遵循全球开放计算项目(Open Compute Project,OCP)标准,具备良好兼容性。


中心还同步演示了AI基础解决方案的运行情况。KT Cloud自主开发并完成专利注册的“Pathfinder”通过数字孪生仿真,实现自律型电力控制。


利用自动驾驶机器人对服务器机房进行巡检的演示也同步进行。中心还设立了体验空间,便于参观者亲身体验并了解基于B200 GPU的AI训练和机器学习运维(MLOps)环境。


KT Cloud首席执行官Choi Jiung表示:“AI创新中心不仅仅是一个展厅,更是验证下一代数据中心技术、构建以客户价值为核心的AI基础设施的关键平台。KT Cloud将提出数据中心技术创新的新标准,引领国内AI生态体系的发展。”



KT Cloud的人工智能创新中心。KT Cloud提供

KT Cloud的人工智能创新中心。KT Cloud提供

View original image


本报道由人工智能(AI)翻译技术生成。

版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。