Meta大举采购NVIDIA芯片发布最新“Llama 3.1”模型
强调与OpenAI、Google、Anthropic处于同一水平
如今已经打开了一条免费使用相当于最新生成式人工智能(AI)ChatGPT‑4.0水准AI的通道。脸书母公司Meta将最新大规模语言模型(LLM)Llama 3.1以开源形式向所有人公开。有分析指出,Meta首席执行官(CEO)Mark Zuckerberg在展示其与垄断AI训练用图形处理器(GPU)市场的英伟达CEO Jensen Huang之间的密切关系的同时,也在撼动既有的AI竞争格局。
Meta首席执行官Mark Zuckerberg与Nvidia首席执行官Jensen Huang互换上衣合影留念。照片由Mark Zuckerberg Instagram提供
View original imageMeta于当地时间23日宣布,将发布“Llama 3.1”。Meta在今年4月推出“Llama 3”后,仅用3个多月时间,便大幅强化了LLM性能,展现出“怪物级”实力。
Llama 3.1中规模最大版本是Llama 3.1 405B。405B的参数(Parameter)多达4050亿个。虽然ChatGPT‑4并未公开参数数量,但这一规模已远远超过GPT‑3的1750亿个。Meta同时公开了小型模型:参数为70亿个的小型模型Llama 3.1 8B,以及参数为700亿个的中型模型Llama 3.1 70B。Meta称,这些模型的性能也实现了大幅提升。Meta强调,Llama 3.1已经超越OpenAI最新模型GPT‑4o以及Anthropic的Claude 3.5 Sonnet。
Meta能够迅速提升Llama性能的秘诀在于最新的英伟达芯片。Meta解释称,在训练Llama 3.1时使用了1.6万块英伟达最新GPU“H100”。Meta CEO Zuckerberg今年年初曾提出目标,要在年底前购入35万块H100。Zuckerberg此前公开过与Huang互换夹克拍摄的照片,引发热议;本月28日还将与Huang举行对谈活动。外界预计,Zuckerberg将在此次活动上披露Llama 3.1开发背后的故事。
Llama是开源的。这意味着其他企业也可以利用Llama开展AI业务,这与OpenAI、谷歌和Anthropic的封闭式AI模型形成鲜明对比。
Zuckerberg强调称:“Llama 3既是可以与最先进(frontier)模型竞争的产品,又是人人都能使用的开源模型。”他以开源Unix系计算机成为主流为例预告称:“AI今后的发展道路也将是开源。”他表示:“从明年开始,有望由Llama成为业界最先进的模型。”
尽管海外企业AI模型的发展速度日益加快,但国内企业的追赶并不容易。根据美国斯坦福大学基础模型研究中心(Center for Research on Foundation Models)的数据,2021年5月首次亮相的Naver第一代“HyperCLOVA”参数数量为820亿个。Naver并未公开最新HyperCLOVA X的参数数量。GIST AI研究生院院长Kim Jongwon解释称:“由于缺乏资金购买用于训练的大规模英伟达GPU,因此很难追上海外大型科技企业的发展速度。”
版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。