订阅式GPU服务阵容扩充
推理速度比H100快2倍
强化AI企业级解决方案

英伟达最新的 GPU H200。

英伟达最新的 GPU H200。

View original image

KT Cloud表示,将在今年第三季度面向人工智能(AI)训练用基础设施服务“AI Train”引入英伟达最新图形处理器(GPU)H200。


在20日举行的“KT Cloud AI业务及GPU即服务(GPU as a Service)”线上说明会上,KT Cloud AI事业组组长 Jung Mijin表示,关于近期获取的英伟达 H200 订阅型GPU服务(GPU即服务)引入计划,“将把 H200 GPU 应用于 AI Train,计划在第三季度提供更为强化的基础设施”。H200是英伟达去年推出的最新GPU产品,重点用于加速AI和高性能计算(HPC)工作负载。以Meta的开源模型 Llama 2 为基准,H200相比前一代型号 H100,在推理速度方面快约2倍,这是其优势所在。


AI Train 是一项专门针对在构建超大规模AI系统时,于短期内集中需要高性能GPU的训练阶段而设计的服务。通过运用容器技术,可以将多块GPU打包为一个资源进行使用,从而提高企业大规模AI开发的效率。目前已提供 A100 和 H100 GPU,本次还将新增性能更强的 H200。


关于具体采购了多少块 H200,并未对外公开。KT Cloud相关负责人表示:“具体的引入数量不便对外披露”,但同时称,“今后也将通过大规模投资,持续提供高性能基础设施服务”。


此外,KT Cloud还表示,为保护个人信息,已按照科学技术情报通信部和个人信息保护委员会共同主管的“信息安全与个人信息保护管理体系认证(ISMS-P)”认证标准构建了安全体系,即便在多用户共享使用的环境中,也能确保数据安全。公司还计划推进面向公共机构的“CSAP”安全认证。


由韩国本土企业 Rebellions 开发的基于NPU(神经网络处理器)的云服务也在同步提供中。NPU相比GPU具有更高的能效,并可降低成本。目前GPU资源基本以多用户共享方式运营,但公司表示也在考虑推出专用使用服务。



KT Cloud计划在第一季度推出高度化的 AIOps(基于AI的IT运维)解决方案,随后陆续推出契合企业环境的 RAG(检索增强生成)服务。检索增强生成是指在机器学习模型中将检索与生成相结合的技术。RAG服务以第三季度上线为目标,当前正准备文档处理、信息检索以及与AI语言模型联动等所需功能。


本报道由人工智能(AI)翻译技术生成。

版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。

不容错过的热点