推理复杂题表现薄弱但整体解题较顺畅
每5分钟就卡死一次……“亟需提升稳定性”

以低成本开发出创新型聊天机器人、令全世界为之震惊的中国人工智能(AI)服务Deepseek,如今又展示了其轻松解答大学修学能力考试试题的实力。


DeepSeek 应用程序界面。路透社 联合新闻网供图

DeepSeek 应用程序界面。路透社 联合新闻网供图

View original image

31日,联合新闻社公开了让Deepseek学习高考题材料并作答后的结果。在被评价为相对“难考”的2024学年度高考国语共同科目中,它在34道题中错了5道,总共被扣12分。现行高考国语领域分为共同科目(第1~34题)和在“语言与媒介”“话语与写作”中二选一的选择科目(第35~45题)。2024学年度高考国语一等等级线为:语言与媒介84分,话语与写作为88分。


Deepseek在现代文学类材料、拼写与词汇相关题目上能迅速给出答案。尤其是在启用“Deepseek R1”功能后,连解题过程也能详细展示。不过,在以当时被视为高难度题目的材料为基础、要求分析虚构民意调查统计数据的第7题,以及比较分析不同数据处理方法的第10题等非文学类材料题目上,则显得相对薄弱。


此外,在询问特定表达中说话者意图的第25、31题,以及询问古典诗歌中所体现表现手法的第34题等试题中,它要么把所有选项都视为正确叙述,要么给出离题的解读,暴露出弱点。


除此之外,在数学试题方面,分值为2分的计算题答得较好,但在需要复杂推理的高难度题目上则遇到一定困难。在几何题中,它无法识别截屏图片;在主观题形式的数列题中,它一股脑代入所有满足初始条件的值,结果陷入无限循环。



同时,Deepseek大约每5分钟就会弹出一次“服务器正忙”的提示,长时间处于宕机状态。即便考虑到来自全球的大量访问者,有报道指出,与曾掀起生成式人工智能热潮的OpenAI聊天机器人ChatGPT刚推出时相比,Deepseek出现故障的频率和程度都更高。


本报道由人工智能(AI)翻译技术生成。

版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。

不容错过的热点