“巨型语言模型优化”……美国英伟达发布下一代AI芯片H200

by Kwon Haeyoung

Published 14 Nov.2023 08:51(KST)

Updated 14 Nov.2023 09:55(KST)

open/close

H100升级版…输出速度提升2倍

引领人工智能（AI）半导体市场的美国英伟达公开了最新AI半导体。

英伟达于13日（当地时间）发布了图形处理器（GPU）H200。该产品应用于作为生成式AI模型基础的大规模语言模型（LLM），并被设计用于对其进行训练。

H200是应用于聊天机器人ChatGPT开发商OpenAI最新LLM——GPT-4训练的H100的升级版本。

H100价格估计为每块2.5万至4万美元。要驱动LLM需要数千颗芯片。尽管H100价格高昂，全球企业仍在为争抢这款半导体展开激烈竞争。

此次发布的H200价格尚未公布。

H200搭载了141千兆字节（GB）的下一代内存HBM3。HBM是高带宽内存的意思，是通过将多颗DRAM垂直连接，大幅提升数据处理速度的高性能产品。HBM3是HBM的第4代产品，被用于让经过训练、可生成文本和图像等内容的LLM进行推理。

英伟达以在Meta的大规模语言模型Llama 2上使用H200的依据为基础表示，H200的输出速度比H100快2倍。此外，H200与H100兼容，已获得H100的AI企业为了使用新版本，无需更换服务器系统或软件。

此外，该半导体还可用于将H200 GPU与基于Arm架构处理器相结合的GH200芯片，以及英伟达计算平台HGX的服务器配置。

H200预计将于明年第二季度正式上市。由此推测，它也将与即将推出的美国半导体企业超威半导体公司（AMD）的MI300X半导体展开竞争。MI300X半导体的内存密度约为英伟达H100的2.4倍，带宽约为其1.6倍。

本报道由人工智能(AI)翻译技术生成。