Upstage-Quanda-KT：凭数学专项模型超越ChatGPT

by Choi Yuri

Published 08 Jan.2024 08:28(KST)

Updated 08 Jan.2024 15:13(KST)

open/close

共同开发的暂名“MathGPT”在数学能力评估权威基准测试中创下世界新纪录

Upstage于8日表示，与运营基于人工智能（AI）学习平台“Qanda”的Mathpresso以及KT共同开发的数学领域特化模型“MathGPT（暂称）”，在击败OpenAI的ChatGPT和微软（Microsoft，MS）模型后，创下了世界新纪录。

去年11月，Upstage和Qanda作为与KT战略合作伙伴关系的一环，启动了MathGPT的开发。Upstage利用Qanda的高质量数学专业数据进行训练，通过微调，使基于自然语言的语言模型能够通过逻辑推理和程序化处理来解决复杂的数学问题。

两家公司开发的MathGPT在“MATH”“GSM8K”等评估语言模型数学能力的代表性基准测试中，取得了超越同级最强微软“ToRA 13B”的令人鼓舞的成绩。其在由1.25万道高难度数学竞赛题构成的MATH基准测试，以及由8500道小学数学题构成、用于测试算术运算能力的GSM8K基准测试中，同时实现了最高性能。

MathGPT在基准测试平均成绩上超越了ChatGPT，在MATH基准测试中甚至超过了GPT‑4。由本土开发的小尺寸模型在高难度数学领域击败了OpenAI、微软等大型科技企业。

通过MathGPT在教育领域验证了成果的Upstage，今后将以前自研模型“Solar”为先锋，着手重组大语言模型（LLM）市场。公司计划横跨金融、流通、医疗、娱乐等各类产业，不仅面向国内市场，更将以全面进军海外为跳板，专注于强化全球竞争力。