韩国资讯比ChatGPT更细致
标注出处防止“幻觉”现象
不如ChatGPT流畅成最大遗憾

人们不禁要问,Naver 大型语言模型(LMM)聊天机器人服务“Clova X”能否与英语世界最高水平的人工智能(AI)一较高下。


Choi Suyeon Naver代表上个月24日在首尔江南区格兰德洲际首尔帕纳斯酒店举行的“Team Naver Conference DAN23”上发布用于超大规模人工智能服务的巨型语言模型“Hyper ClovaX”。照片=记者Kang Jinhyeong aymsdream@

Choi Suyeon Naver代表上个月24日在首尔江南区格兰德洲际首尔帕纳斯酒店举行的“Team Naver Conference DAN23”上发布用于超大规模人工智能服务的巨型语言模型“Hyper ClovaX”。照片=记者Kang Jinhyeong aymsdream@

View original image

Clova X 是上月24日推出的 Naver 人工智能(AI)“HyperClova X”的聊天机器人版本模型。近期进入测试版服务阶段,申请用户可按顺序陆续体验服务。


利用大型语言模型的聊天机器人服务,最近在国际舞台上的竞争日趋激烈。处于领先地位的 ChatGPT 已经开启付费订阅模式,Meta 的 LLaMA 等开源人工智能也在不断取得成果。在此背景下,首个“国产 AI”Clova X具有什么优势?


比 ChatGPT 多学习6500倍的韩语
引发对ChatGPT可靠性争议的“世宗大王扔MacBook”提问。图片由网络社区提供

引发对ChatGPT可靠性争议的“世宗大王扔MacBook”提问。图片由网络社区提供

View original image

此前 Naver 将“韩语特化”作为 Clova X 的优势之一。事实上,Naver 首席执行官 Choi Suyeon 在 HyperClova X 发布记者会上曾强调称:“相比 ChatGPT-3.5,我们多学习了6500倍的韩语,是一款理解包括韩语在内、以及韩国历史、法律、制度等在内一切内容的人工智能。”


生成式语言人工智能的知识水平取决于其学习的“数据集”的规模和质量。对人工智能而言,数据集相当于教科书。ChatGPT 由总部位于美国的 OpenAI 开发,因此在数据集中英语所占比重必然极高。


因此,ChatGPT 的韩语能力并不突出。用韩语提问时,它经常给出答非所问的回答,或者无法理解语境,这种情况屡见不鲜。


更大的问题是语言模型最大的功能性缺陷——“幻觉(Hallucination)”现象。即人工智能在自行生成句子的过程中,捏造现实中并不存在的虚假信息。例如所谓“世宗大王扔 MacBook 事件”。


当有用户请求“请告诉我关于世宗大王扔 MacBook 事件的情况”时,ChatGPT 直接虚构了一个故事,并像真实发生过一样进行说明。从创造性角度看或许可以称赞,但对“聊天机器人”而言,这是致命的缺陷。


紧迫的“幻觉”问题得到遏制……还能利用最新韩国信息
Clova X在给出回答的同时附上出处链接,从而提升了可信度。图片由Clova X提供

Clova X在给出回答的同时附上出处链接,从而提升了可信度。图片由Clova X提供

View original image

从实际使用 Clova X 的结果来看,Naver 似乎已经成功遏制了 GPT-3.5 的幻觉问题。首先,Clova X 并非只输出回答内容,还会附上作为该回答依据的权威报道等内容。用户可以更轻松地判断人工智能的回答是否属于幻觉。


Clova X 的回答(上)和 ChatGPT 的回答 【图片来源=Clova X, ChatGPT 提供】

Clova X 的回答(上)和 ChatGPT 的回答 【图片来源=Clova X, ChatGPT 提供】

View original image

可利用的韩语信息量也远大于 ChatGPT-3.5。ChatGPT 目前仍只能说明截至 2021 年发生的事情。例如,若询问“现任大韩民国总统是谁”,ChatGPT 会输出一句“无法回答相关内容”。


相反,Clova X 会准确回答“尹锡悦总统”,并能提供简要的人物信息。


韩语特化 AI 能否成功

ChatGPT、LLaMA、Stable Diffusion 等当前主流的大型生成式人工智能模型,大多由美国、英国等英语国家开发。因此,随着人工智能发展不断高度化,对其他语言的支持难免被弱化。这正是 Naver 的“韩语特化 AI”在韩国市场具有强大吸引力的原因。


不过,要想与最高水平的人工智能直接竞争,看来仍有一段路要走。首先是服务优化问题。


HyperClova X 在上月24日公开当日,由于访问用户蜂拥而至,导致指令(提示词)回答延迟或出错等,服务一度无法顺畅运行。今后在 100% 开放服务时,需要做好万全准备,防止类似情况重演。


Clova X更加稳定,但ChatGPT更为流畅。[图片来源=Clova X, ChatGPT]

Clova X更加稳定,但ChatGPT更为流畅。[图片来源=Clova X, ChatGPT]

View original image

另外,从具备多种防止幻觉现象的功能这一点来看,Clova X 比 ChatGPT 更“稳定”,但流畅度却不及后者。例如,当就“日本核电站核污染水排放”这一可能出现多种争议焦点的问题提问时,ChatGPT 能介绍多种视角,而 Clova X 仅停留在对事件经过的简要概述。



Naver 表示,今后将持续提升作为 Clova X 基础的 HyperClova X 模型的性能,并计划通过人工智能模型向企业提供企业对企业(B2B)云端定制 AI 解决方案、生产力提升工具等服务。


本报道由人工智能(AI)翻译技术生成。

版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。