“开源是AI之路” Meta发布顶级AI模型“Llama 3.1”

by Paek Jongmin

Published 24 Jul.2024 09:50(KST)

Meta大举采购NVIDIA芯片发布最新“Llama 3.1”模型
强调与OpenAI、Google、Anthropic处于同一水平

如今已经打开了一条免费使用相当于最新生成式人工智能（AI）ChatGPT‑4.0水准AI的通道。脸书母公司Meta将最新大规模语言模型（LLM）Llama 3.1以开源形式向所有人公开。有分析指出，Meta首席执行官（CEO）Mark Zuckerberg在展示其与垄断AI训练用图形处理器（GPU）市场的英伟达CEO Jensen Huang之间的密切关系的同时，也在撼动既有的AI竞争格局。

Meta首席执行官Mark Zuckerberg与Nvidia首席执行官Jensen Huang互换上衣合影留念。照片由Mark Zuckerberg Instagram提供

Meta于当地时间23日宣布，将发布“Llama 3.1”。Meta在今年4月推出“Llama 3”后，仅用3个多月时间，便大幅强化了LLM性能，展现出“怪物级”实力。

Llama 3.1中规模最大版本是Llama 3.1 405B。405B的参数（Parameter）多达4050亿个。虽然ChatGPT‑4并未公开参数数量，但这一规模已远远超过GPT‑3的1750亿个。Meta同时公开了小型模型：参数为70亿个的小型模型Llama 3.1 8B，以及参数为700亿个的中型模型Llama 3.1 70B。Meta称，这些模型的性能也实现了大幅提升。Meta强调，Llama 3.1已经超越OpenAI最新模型GPT‑4o以及Anthropic的Claude 3.5 Sonnet。

Meta能够迅速提升Llama性能的秘诀在于最新的英伟达芯片。Meta解释称，在训练Llama 3.1时使用了1.6万块英伟达最新GPU“H100”。Meta CEO Zuckerberg今年年初曾提出目标，要在年底前购入35万块H100。Zuckerberg此前公开过与Huang互换夹克拍摄的照片，引发热议；本月28日还将与Huang举行对谈活动。外界预计，Zuckerberg将在此次活动上披露Llama 3.1开发背后的故事。

Llama是开源的。这意味着其他企业也可以利用Llama开展AI业务，这与OpenAI、谷歌和Anthropic的封闭式AI模型形成鲜明对比。

Zuckerberg强调称：“Llama 3既是可以与最先进（frontier）模型竞争的产品，又是人人都能使用的开源模型。”他以开源Unix系计算机成为主流为例预告称：“AI今后的发展道路也将是开源。”他表示：“从明年开始，有望由Llama成为业界最先进的模型。”

必读新闻

三星放缓之际猛然追上…中国D램一年内转亏为盈

尽管海外企业AI模型的发展速度日益加快，但国内企业的追赶并不容易。根据美国斯坦福大学基础模型研究中心（Center for Research on Foundation Models）的数据，2021年5月首次亮相的Naver第一代“HyperCLOVA”参数数量为820亿个。Naver并未公开最新HyperCLOVA X的参数数量。GIST AI研究生院院长Kim Jongwon解释称：“由于缺乏资金购买用于训练的大规模英伟达GPU，因此很难追上海外大型科技企业的发展速度。”

한글 기사 보기

本报道由人工智能(AI)翻译技术生成。