“巨型语言模型优化”……美国英伟达发布下一代AI芯片H200
H100升级版…输出速度提升2倍
引领人工智能(AI)半导体市场的美国英伟达公开了最新AI半导体。
英伟达于13日(当地时间)发布了图形处理器(GPU)H200。该产品应用于作为生成式AI模型基础的大规模语言模型(LLM),并被设计用于对其进行训练。
H200是应用于聊天机器人ChatGPT开发商OpenAI最新LLM——GPT-4训练的H100的升级版本。
H100价格估计为每块2.5万至4万美元。要驱动LLM需要数千颗芯片。尽管H100价格高昂,全球企业仍在为争抢这款半导体展开激烈竞争。
此次发布的H200价格尚未公布。
H200搭载了141千兆字节(GB)的下一代内存HBM3。HBM是高带宽内存的意思,是通过将多颗DRAM垂直连接,大幅提升数据处理速度的高性能产品。HBM3是HBM的第4代产品,被用于让经过训练、可生成文本和图像等内容的LLM进行推理。
英伟达以在Meta的大规模语言模型Llama 2上使用H200的依据为基础表示,H200的输出速度比H100快2倍。此外,H200与H100兼容,已获得H100的AI企业为了使用新版本,无需更换服务器系统或软件。
此外,该半导体还可用于将H200 GPU与基于Arm架构处理器相结合的GH200芯片,以及英伟达计算平台HGX的服务器配置。
H200预计将于明年第二季度正式上市。由此推测,它也将与即将推出的美国半导体企业超威半导体公司(AMD)的MI300X半导体展开竞争。MI300X半导体的内存密度约为英伟达H100的2.4倍,带宽约为其1.6倍。
本报道由人工智能(AI)翻译技术生成。
版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。