用于超大规模人工智能(AI)研究与开发的AI半导体基础设施,如今只需在在线专用门户上点击几下,就能轻松使用。


KT Cloud表示,已将本土无晶圆半导体设计专业企业Rebellions的“ATOM”应用于云端神经网络处理器(NPU)基础设施服务,并将其商用化,自5月30日起正式提供该服务。

搭载Rebellion Atom芯片的kt cloud NPU基础设施服务 【图片由KT Cloud提供】

搭载Rebellion Atom芯片的kt cloud NPU基础设施服务 【图片由KT Cloud提供】

View original image

NPU采用针对AI领域最优化的架构设计,被称为AI半导体。与同级别图形处理器(GPU)相比,其运算速度更快、功耗更低,可在AI研发周期和成本方面带来革新。KT Cloud与Rebellions合作,将在全球市场也获得高性能认可的NPU“ATOM”搭载到云端NPU基础设施上并实现商用。KT Cloud将NPU应用于云平台,使其可在云端使用,同时通过构建和管理NPU资源共享池以及实现自动资源配置等,将其服务化。企业可通过专用门户轻松便捷地开展基于NPU的AI训练与推理。


云端NPU基础设施只需点击几下,客户即可自行创建资源、使用算力会话,并进行管理与监控,相比自建型基础设施,使用便捷性更高。此外,当需要高性能、低功耗的NPU特性时,企业可以按需使用所需规模的资源,从而大幅缩短AI企业的研发周期并降低成本。


KT Cloud将首先面向“韩国云项目”支持计划中“AI代金券支持项目”和“高性能计算支持项目”的入选企业提供NPU基础设施。该项目的宗旨是支持AI半导体初期市场需求的培育,并向中小与风险企业提供基于国产AI半导体的算力资源。KT Cloud计划在今年下半年将服务扩展至更广泛的企业客户。


此次服务中搭载的Rebellions“ATOM”,继专门面向金融交易的AI半导体“ION”之后,是Rebellions推出的第二款AI半导体。目前已具备相当于国内其他无晶圆企业正在开发的第二代NPU水平的性能。ATOM是唯一支持Transformer语言模型(机器翻译模型)和浮点运算的国产NPU。在AI半导体技术力验证大赛“MLPerf”中,结果显示,与英伟达A2和T4、高通Cloud AI 100相比,在图像处理(ResNet)方面快1.4倍至3.4倍,在语言模型(BERT-Large)方面快1.4倍至2倍。其采用最高60瓦的低功耗设计,并使用三星5纳米极紫外(EUV)工艺制造,与业界普遍使用的GPU相比,在视觉模型上电源效率约高6倍,在语言模型上约高2倍,大幅降低了功耗。


Rebellions目前也在准备进一步升级ATOM性能的版本。配合这一进展,KT Cloud将对NPU基础设施进行高度化,并计划在2024年以后推出下一代NPU型号“Rebel”。


Rebellions首席执行官Park Sunghyun就本次NPU基础设施服务表示:“近期在MLPerf中,ATOM在视觉和语言模型两方面都证明了其全球顶级水准的能力,如今又通过KT Cloud的服务在数据中心实现商用,我们对此深感自豪。我们将以Rebellions的技术实力为基础,为激活韩国AI产业作出贡献,并在今后持续引领AI半导体市场。”


KT Cloud今后将设计并构建NPU农场(Farm)和云平台,通过验证各类AI应用服务,获取AI半导体参考案例。同时,通过多样化的技术合作,引领低成本、高性能、高效率的AI基础设施创新,并打通从国产AI半导体、软件栈、云平台到AI应用服务的完整AI全栈,力争在2025年前进军全球市场。



KT Cloud首席执行官Yoon Dongsik表示:“KT Cloud继推出面向超大规模AI的按量计费AI基础设施服务HyperScale AI Computing(HAC),降低AI产业门槛之后,又通过国内首个云端NPU基础设施商用化,引领AI领域的创新。今后我们也将通过AI基础设施创新和AI半导体的高度化,继续走在激活韩国超大规模AI产业的前列。”


本报道由人工智能(AI)翻译技术生成。

版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。