Upstage称“自研AI性能已超越ChatGPT”

by Choi Yuri

Published 01 Aug.2023 13:51(KST)

在Hugging Face评测中评分超越GPT-3.5

Upstage表示，其自主研发的生成式人工智能（AI）模型在全球最大机器学习平台Hugging Face运营的“开放大语言模型（LLM）排行榜”评估中获得72.3分，超越作为ChatGPT基础模型的GPT‑3.5，位居第1名。

Hugging Face开放LLM排行榜被视为开源生成式AI模型的风向标。全球500余个开源模型围绕推理与常识能力、语言理解综合能力以及防止幻觉（Hallucination）等4项指标的平均分展开竞争并排定名次。

图片由Upstage提供

上月，Upstage通过Hugging Face公开的300亿参数模型获得平均67分，超越同日发布的Meta“LLaMA 2”700亿参数模型，首次夺得韩国LLM第1名。随后，Upstage又基于更多数据，对最新版LLaMA 2进行微调并推出新模型。结果显示，Upstage 70B模型在排行榜评估中取得72.3分，超过了作为ChatGPT基础模型的GPT‑3.5在基准测试中的成绩（71.9分）。