参数规模较前代扩大3倍…处理速度与成本保持不变
在LLM基准测试中性能较前代提升2倍

Upstage公司24日表示,已公开发布专注于人工智能(AI)代理的下一代大型语言模型(LLM)“Solar Pro 3”。


“Solar Pro 3”拥有1020亿个参数,相比前一代“Solar Pro 2”规模扩大了3倍以上,但仍将成本和处理速度(每秒处理事务数,TPS)维持在同一水平,从而进一步提升了效率。

Upstage公司24日表示,已公开发布专注于人工智能代理的下一代大型语言模型“Solar Pro 3”。Upstage公司提供

Upstage公司24日表示,已公开发布专注于人工智能代理的下一代大型语言模型“Solar Pro 3”。Upstage公司提供

View original image

在性能方面,该模型在执行多阶段任务的工具调用、复杂指令执行等整个代理任务流程上均有所提升。具体来看,在代理综合性能(Tau2-all)、编码(Terminal Bench 2、SWE Bench)、指令执行(IFBench)等主要大型语言模型基准测试中,相比前一代产品性能提高了2倍以上。


此外,通过应用Upstage自研强化学习技术“SnapPO”,进一步提升了作为代理AI核心能力的深度推理水平。模型不仅能够生成简单回答,还能通过分步思考增强推理的一致性和语境判断能力,并在竞赛级数学(HMMT'26、AIME'26)和研究生水平科学(GPQA-Diamond)等高难度推理评估中取得了优异成绩。


在回答质量方面,模型能够反映用户意图及其细微差别,从而提升在真实使用环境中的体验质量。在普通用户偏好(Arena-hard-v2)和韩语用户偏好(Ko-Arena-hard-v2)等主要评估指标上均呈现出改善结果。


“Solar Pro 3”可通过全球AI模型服务平台“OpenRouter”和Upstage自有应用程序编程接口(API)立即接入使用。Upstage方面表示,借助“Solar Pro 3”,企业可以以小型模型的成本引入大型模型级别的性能。



Upstage首席执行官Kim Seonghun表示:“‘Solar Pro 3’并非只追求模型性能指标,而是以在真实业务环境中发挥实效、推动代理AI实用性跃升为目标开发的产品。今后Upstage也将继续以业内顶尖技术实力为基础,持续扩展真正应用于产业一线的AI生态。”


本报道由人工智能(AI)翻译技术生成。

版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。

不容错过的热点