运算性能较前代提升4倍·能效提升2倍↑
明年上半年开始量产
全球人工智能(AI)半导体设计企业(无晶圆厂)Sapeon推出了面向数据中心的AI半导体“X330”,在支持大规模语言模型(LLM)的同时,将运算速度较前代产品提升了4倍。
Sapeon于16日在首尔江南区COEX举行的SK Tech Summit上公开了X330。
AI半导体是在超高速、低功耗条件下执行AI训练和推理所需运算的半导体,可谓AI的大脑。多数企业目前利用图形处理器(GPU)来实现AI服务,但其价格高昂且耗电量大,AI半导体因此被视为解决方案。X330是一款用于推理的神经网络处理器(NPU),其运算性能较前代产品X220提升4倍,能效提高超过2倍。公司方面表示,与今年推出的竞争产品相比,X330的运算性能约高出2倍,能效高出1.3倍。Sapeon首席执行官 Ryu Sujeong表示:“简单计算的话,以前需要4颗X220才能处理的运算,现在1颗X330就能完成”,“凭借更高的性能功耗比,可降低数据中心这一顽疾——电力成本和碳排放。”
本次还新增了对LLM的支持,在作为对话式AI ChatGPT底层技术的Transformer架构LLM上也展现出优异性能。此外,与前代相比,应用范围大幅扩展,可在各类行业中加以利用。
Sapeon计划通过提升成本效益的X330,加快布局AI服务模型开发企业及数据中心市场。公司将面向主要客户开展X330样品测试和可靠性验证工作,随后从明年上半年开始量产。
Sapeon尤其专注于推理型市场。全球AI数据服务器市场正以年均31%的速度增长,其中推理市场的年均增速为32%,比训练市场高出5个百分点。Ryu代表表示:“我们有信心在目前使用GPU和中央处理器(CPU)的市场中,成为改变格局的领跑者。”
同时,公司计划在此次发布的X330之外,今后还将推出用于自动驾驶汽车、闭路电视(CCTV)等高性能边缘设备的AI NPU。明年将发布专为自动驾驶打造的X340型号。公司还计划与SK Telecom合作,利用AI半导体提供基于AI和大数据分析的防范语音钓鱼,以及垃圾短信、短信钓鱼防护系统。
Sapeon是一家从SK Telecom分拆出来、进军全球市场的AI半导体无晶圆厂企业。X330是该公司自去年自SK Telecom分拆以来推出的首款产品。Ryu Sujeong Sapeon代表补充称:“我们一直在努力提升竞争力,思考SK集团所拥有的大量AI解决方案如何在Sapeon芯片上运行并实现最优化”,“将打造一种良性循环结构,使合作伙伴的解决方案在Sapeon芯片上运行时,能够以更低的运营成本获得更高的竞争力。”
版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。