o1预览:45道题仅错1道
“超越人类的时代不远了”

人工智能(AI)在大学修学能力考试(高考)国语科目中取得接近满分的成绩,拿下了1等级。


图片由Pixabay提供

图片由Pixabay提供

View original image

国内人工智能初创企业Marker AI利用OpenAI的人工智能模型参加了2025学年度高考国语科目考试,其中“o1-preview”模型在45道题中仅错1题,获得原始分数97分,对应1等级。在考试规定的80分钟中,o1-preview只用了35分钟就拿到1等级成绩。


“o1-preview”唯一做错的是第8题,该题要求阅读两篇关于近代化的说明文非文学材料,并将题目中给出的案例代入,考察应试者的逻辑思维能力。这道题在2025学年度高考国语科目中错误率最高,达81.5%,也是考生公认最难的题目。Marker AI解释称,o1-preview在理解材料与选项的语境、把握出题者隐藏意图的过程中出现了失误,掉进了命题组精心设置的“有吸引力的错误选项”陷阱。


Marker AI在过去10年间一直对高考国语科目进行人工智能模型处理能力评估。解答2025学年度高考国语科目的“o1-mini”取得原始分78分,“gpt-4o”取得75分,均被划入4等级。


图片由 Marker AI 提供

图片由 Marker AI 提供

View original image

o1-preview的进步速度十分迅猛。在去年的高考国语科目中,它的原始分为88分,仅用1年时间就将成绩提升到接近满分。GPT-4o在去年的高考国语考试中原始分为65分,拿到4等级。Meta、谷歌等公司的生成式人工智能在最近10个年度的高考国语科目中,也仅取得相当于3等级至9等级区间的成绩。



Marker AI研究员Jin Manseongsik在博客中表示:“在2025年高考中取得的97分这一接近满分的成绩,表明大型语言模型(Large Language Model,LLM)的韩语能力距离超越人类表现的时刻已经不远了。”


本报道由人工智能(AI)翻译技术生成。

版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。

不容错过的热点