在Hugging Face评测中评分超越GPT-3.5
Upstage表示,其自主研发的生成式人工智能(AI)模型在全球最大机器学习平台Hugging Face运营的“开放大语言模型(LLM)排行榜”评估中获得72.3分,超越作为ChatGPT基础模型的GPT‑3.5,位居第1名。
Hugging Face开放LLM排行榜被视为开源生成式AI模型的风向标。全球500余个开源模型围绕推理与常识能力、语言理解综合能力以及防止幻觉(Hallucination)等4项指标的平均分展开竞争并排定名次。
上月,Upstage通过Hugging Face公开的300亿参数模型获得平均67分,超越同日发布的Meta“LLaMA 2”700亿参数模型,首次夺得韩国LLM第1名。随后,Upstage又基于更多数据,对最新版LLaMA 2进行微调并推出新模型。结果显示,Upstage 70B模型在排行榜评估中取得72.3分,超过了作为ChatGPT基础模型的GPT‑3.5在基准测试中的成绩(71.9分)。
Upstage首席执行官Kim Seonghun表示:“Upstage的生成式AI模型以超越ChatGPT的性能,验证了我们处于世界最高水平的技术实力,感到非常高兴。今后,Upstage将以压倒性的技术实力为基础,加快提升在国内外私有化AI市场的主导力。”
本报道由人工智能(AI)翻译技术生成。
版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。