高难度主观题部分作答正确…在几何与推理题型上暴露弱点

OpenAI于7日(以美国当地时间为准)正式发布旗下最新语言模型GPT-5。图片由OpenAI提供

OpenAI于7日(以美国当地时间为准)正式发布旗下最新语言模型GPT-5。图片由OpenAI提供

View original image

OpenAI于当地时间7日发布的下一代大型语言模型(LLM)“GPT-5”,在大学修学能力考试(高考)解题中取得了有望报考首都圈上位大学的成绩。


8日,将2025学年度高考国语(话语与写作)·数学(微积分)·英语科目试题从第1题到最后一题全部输入GPT-5聊天机器人并进行评分后发现,其按原始分数计算,国语95分、数学82分、英语92分。与去年高考等级分数线相比,国语和英语相当于1等级,数学为2等级水平。


此次测试中最突出的变化是数学计算能力。GPT-5在以图片形式接收第1至第30题数学题目的情况下,大部分题目都能在1至2秒内给出答案。解题过程以“LaTeX”公式呈现,提高了可读性。尤其是对于分值为4分的高难度主观题(第29、30题)中的一题,经过约1分30秒的计算后,准确给出了答案和解题过程。不过,在需要比较复杂条件的推理类题目或需要判断图形的几何题中,则出现了“看似合理的错误答案”或“无正确答案”等结果,暴露出一定局限。


在国语科目中,非文学和写作题全部答对,但在现代文学比较(第22题)和古典诗歌解读(第34题)题目上出现了错误。英语则在句子顺序排列题(第37、43题)上,即便给予重新作答机会,仍然选择了同样的错误选项,总计错了4题。



在选考科目中,GPT-5在社会探究科目上表现较强。对于社会文化、伦理与思想等科目,即便是难题也能准确解答,但在物理、化学等需要图表分析的科学探究科目中,即使是相对简单的题目,错误率也较高。


本报道由人工智能(AI)翻译技术生成。

版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。

不容错过的热点