生产力怪物“GPT-4”来了：“能让企业掏钱买单的产品”

by Choi Yuri

Published 15 Mar.2023 12:25(KST)

Updated 15 Mar.2023 16:35(KST)

open/close

OpenAI发布进化版AI“GPT-4”
美国律师考试成绩跻身前10%
支持多模态，可辅助视障人士

美国人工智能初创公司OpenAI公开了超大规模人工智能“GPT-4”。其在特定领域的专业知识被提升到接近人类的水平。不仅能理解文本，也开始理解图像。业界评价认为，这已经是一个足以让企业为了提升生产力而愿意掏钱购买的出色产品。

当地时间14日，OpenAI发布了GPT-4。这是对应用在人工智能聊天机器人“ChatGPT”上的GPT-3.5进行高度升级的版本。自去年11月推出GPT-3.5以来，仅过去4个月。

最引人注目的变化是实现了多模态功能。多模态人工智能不仅能处理文字，还能理解和生成图像、视频、语音等复合信息。与只能通过文字交流的GPT-3.5不同，GPT-4可以同时理解文字和图像。在演示视频中，当给它看一张松鼠拿着相机拍摄橡果的图片时，它用文字进行了说明，还补充说松鼠像人一样拿着相机“很有趣”。不过，它目前还不能将文字转换成图像。由OpenAI开发的另一款人工智能“DALL·E 2”，在输入“手捧鲜花的少女”时，则可以直接生成画作。

OpenAI介绍的GPT-4首个合作伙伴是“Be My Eyes”。这是一项面向视障人士的“人工智能志愿者”服务，会通过语音告诉用户手机屏幕上出现了什么。比如，拍一张冰箱内部的照片，它会说明里面有什么；在健身房拍下器械上的说明，它会告诉你该按哪个按钮才能使用机器学习设备。

与GPT-3.5相比，GPT-4变得更加聪明。GPT-4以位列前10%的成绩通过了美国律师资格考试模拟测试，在专业领域展现出可以与人类竞争的可能性。在美国大学入学考试（SAT）的阅读和数学科目中，它分别取得了前7%、前11%的成绩。语言能力也有所进化。在演示中，当给它一篇长文并要求用以字母“G”开头的句子进行总结时，GPT-3.5无法完成，而GPT-4则利落地给出了答案。Naver Cloud AI实验室所长Ha Jungwoo表示：“它已经进化为一款能大幅提升生产力的极其强大的工具。”他评价称：“在专业知识领域有了很大进步，已经到了企业愿意花钱使用的程度。”

GPT-4的对话记忆量是3.5版本的8倍。如果说GPT-3.5在与用户对话时大约能记住4至5页书的内容，那么GPT-4就能记住相当于50页短篇小说的内容。这意味着GPT-4在对话时，仍然可以记得并引用35页之前提到的内容。

决定人工智能性能的参数数量并未对外公开。专家们认为，它的规模虽已超过GPT-3.5的1750亿个参数，但肯定没有达到部分人士提出的100万亿个参数。100万亿个参数被认为与人类大脑大致处于同一水平。

不过，其局限依然存在。把错误答案说得像正确答案一样的“幻觉”现象虽有所减少，但仍未完全消除。在内部事实性评估中，GPT-4的得分比GPT-3.5高出40%。在GPT-3.5阶段，用户还可以诱导人工智能打破规则、进行所谓“越狱”，而GPT-4则更难被欺骗。OpenAI强调称：“关键在于，它仍然不能被完全信任”，“尤其是在风险较高的场景中使用时，必须由人进行复核，或提供额外依据，并尽量避免高风险用途等，需要格外谨慎。”

必读新闻

“股票不用交税” 明年起年超250万韩元币圈收益征税…投资者强烈反对

其韩语能力也较为有限。可翻译的语言虽然扩展到了26种，但与专门针对韩语训练的超大规模人工智能模型相比仍有差距。比如，当被问到“在高速公路上能不能骑摩托车”时，GPT-3.5和GPT-4给出的答案相同，都模糊地回答称“原则上通常可以，但根据国家或地区不同，相关管制可能有所差异”。相较之下，Naver的“HyperCLOVA X”则会回答：“在韩国，高速公路和汽车专用道路禁止摩托车通行。”

한글 기사 보기

本报道由人工智能(AI)翻译技术生成。