KT Cloud商用“云端NPU基础设施”

by Oh Suyon

Published 27 Jun.2023 10:04(KST)

用于超大规模人工智能（AI）研究与开发的AI半导体基础设施，如今只需在在线专用门户上点击几下，就能轻松使用。

KT Cloud表示，已将本土无晶圆半导体设计专业企业Rebellions的“ATOM”应用于云端神经网络处理器（NPU）基础设施服务，并将其商用化，自5月30日起正式提供该服务。

搭载Rebellion Atom芯片的kt cloud NPU基础设施服务【图片由KT Cloud提供】

NPU采用针对AI领域最优化的架构设计，被称为AI半导体。与同级别图形处理器（GPU）相比，其运算速度更快、功耗更低，可在AI研发周期和成本方面带来革新。KT Cloud与Rebellions合作，将在全球市场也获得高性能认可的NPU“ATOM”搭载到云端NPU基础设施上并实现商用。KT Cloud将NPU应用于云平台，使其可在云端使用，同时通过构建和管理NPU资源共享池以及实现自动资源配置等，将其服务化。企业可通过专用门户轻松便捷地开展基于NPU的AI训练与推理。

云端NPU基础设施只需点击几下，客户即可自行创建资源、使用算力会话，并进行管理与监控，相比自建型基础设施，使用便捷性更高。此外，当需要高性能、低功耗的NPU特性时，企业可以按需使用所需规模的资源，从而大幅缩短AI企业的研发周期并降低成本。

KT Cloud将首先面向“韩国云项目”支持计划中“AI代金券支持项目”和“高性能计算支持项目”的入选企业提供NPU基础设施。该项目的宗旨是支持AI半导体初期市场需求的培育，并向中小与风险企业提供基于国产AI半导体的算力资源。KT Cloud计划在今年下半年将服务扩展至更广泛的企业客户。

此次服务中搭载的Rebellions“ATOM”，继专门面向金融交易的AI半导体“ION”之后，是Rebellions推出的第二款AI半导体。目前已具备相当于国内其他无晶圆企业正在开发的第二代NPU水平的性能。ATOM是唯一支持Transformer语言模型（机器翻译模型）和浮点运算的国产NPU。在AI半导体技术力验证大赛“MLPerf”中，结果显示，与英伟达A2和T4、高通Cloud AI 100相比，在图像处理（ResNet）方面快1.4倍至3.4倍，在语言模型（BERT-Large）方面快1.4倍至2倍。其采用最高60瓦的低功耗设计，并使用三星5纳米极紫外（EUV）工艺制造，与业界普遍使用的GPU相比，在视觉模型上电源效率约高6倍，在语言模型上约高2倍，大幅降低了功耗。

Rebellions目前也在准备进一步升级ATOM性能的版本。配合这一进展，KT Cloud将对NPU基础设施进行高度化，并计划在2024年以后推出下一代NPU型号“Rebel”。

Rebellions首席执行官Park Sunghyun就本次NPU基础设施服务表示：“近期在MLPerf中，ATOM在视觉和语言模型两方面都证明了其全球顶级水准的能力，如今又通过KT Cloud的服务在数据中心实现商用，我们对此深感自豪。我们将以Rebellions的技术实力为基础，为激活韩国AI产业作出贡献，并在今后持续引领AI半导体市场。”

KT Cloud今后将设计并构建NPU农场（Farm）和云平台，通过验证各类AI应用服务，获取AI半导体参考案例。同时，通过多样化的技术合作，引领低成本、高性能、高效率的AI基础设施创新，并打通从国产AI半导体、软件栈、云平台到AI应用服务的完整AI全栈，力争在2025年前进军全球市场。

必读新闻

“去三星电子、海力士的都是学习差的”……现代汽车员工的哀叹

KT Cloud首席执行官Yoon Dongsik表示：“KT Cloud继推出面向超大规模AI的按量计费AI基础设施服务HyperScale AI Computing（HAC），降低AI产业门槛之后，又通过国内首个云端NPU基础设施商用化，引领AI领域的创新。今后我们也将通过AI基础设施创新和AI半导体的高度化，继续走在激活韩国超大规模AI产业的前列。”

한글 기사 보기

本报道由人工智能(AI)翻译技术生成。

KT Cloud商用“云端NPU基础设施”

必读新闻

不容错过的热点