工程师分享必应AI聊天机器人使用体验引热议
被问无线吸尘器缺点却答“电源线太短”

[亚洲经济 记者 Jeong Hyeonjin] 有观点指出,微软(MS)搜索引擎“Bing”内置的人工智能聊天机器人正在大量输出错误信息。在谷歌人工智能聊天机器人“Bard”在公开演示场合给出错误答案、导致股价暴跌之后,微软于本月7日(当地时间)推出的人工智能聊天机器人也被指“错误百出”。在人工智能(AI)聊天机器人竞争日趋激烈的背景下,其回答的准确性及与事实的符合程度预计将成为今后备受关注的焦点。


图片由美联社 联合新闻提供

图片由美联社 联合新闻提供

View original image
◆ MS Bing AI聊天机器人:是无线吸尘器,却说缺点是电源线太短……

20多岁的软件工程师 Dmitri Brereton 于14日在个人博客上发布了使用微软 Bing AI 聊天机器人的体验。他称,Bing AI 聊天机器人的演示(实验)版本给出了完全错误的回答,并批评说:“无法信任 Bing AI。微软为了在短期内进行大规模宣传,故意公开了有问题的产品。”从他在领英(LinkedIn)上发布的履历来看,Brereton 主要在硅谷信息技术企业工作,目前也在一家总部位于加利福尼亚州旧金山的客户关系管理(CRM)软件公司担任工程师。


据博客文章介绍,Brereton 首先为了购买宠物用吸尘器,要求它将几款畅销产品的优缺点列成清单。在 Bing AI 聊天机器人推荐的吸尘器中,有一款美国吸尘器品牌 Bissell 的产品,其缺点被列为噪音大、电源线较短。问题在于,这款产品其实是无线吸尘器,而被 Bing AI 聊天机器人标注为信息来源并展示出来的报道内容中,根本没有提及噪音问题。Brereton 讥讽称:“希望 Bing AI 享受一下被以名誉毁损为由起诉的滋味。”

(图片来源  软件工程师 Dmitry Brereton 在博客上发布的文章截图)

(图片来源 软件工程师 Dmitry Brereton 在博客上发布的文章截图)

View original image

Brereton 还向 Bing AI 聊天机器人提出请求,称自己将前往墨西哥首都墨西哥城旅行5天,请它制定一份在当地享受夜生活的行程。Bing AI 聊天机器人推荐了一家当地酒吧,并提示他进入酒吧官网进行预约并查看菜单。但实际上在该官网上既无法预约,也无法查看菜单。对于另外两家酒吧,它则回答称线上没有评论,而 Brereton 指出,实际上可以看到上千条评论。


它还出现了捏造企业业绩或给出错误数字的情况。Brereton 询问了美国时装企业 GAP 去年第三季度的业绩数据。经调整后的毛利率为38.7%,但它却给出了调整前毛利率37.4%的数字,并声称这是调整后的数据。对于摊薄每股收益,它干脆凭空编造了一个新数字,回答为0.42美元,而实际数据为0.71美元(经调整后)、0.77美元(调整前)。


Brereton 表示:“Bing AI 聊天机器人在吸引媒体高度关注方面发挥了很大作用,但这一产品并不优于谷歌的 Bard”,“微软竟然把这样一个不断给出错误答案的产品包装成好产品推出市场,让我十分惊讶,而大家居然都对这场 Bing AI 聊天机器人的营销行为毫无质疑就一窝蜂追捧,更让我感到震惊。”


对 Brereton 的文章进行报道的美国财经媒体《Business Insider》援引微软方面的回应称:“我们已经注意到这篇文章。我们知道还有许多工作要做,也意识到在演示期间系统可能会提供错误信息。这正是我们需要收集反馈,以便进一步学习和改进的原因所在。”

◆ “不要急于投资AI聊天机器人”

围绕微软 Bing AI 聊天机器人的质疑,是在谷歌 Bard 因给出错误答案而受到批评之后出现的。


在获得微软投资的 OpenAI 推出 ChatGPT 并取得巨大成功后,谷歌感到形势紧迫,于本月6日公开并演示了人工智能聊天机器人 Bard。当时,谷歌 Bard 对“要如何向一名9岁儿童解释‘詹姆斯·韦伯太空望远镜’的新发现”这一提问回答称:“它被用于首次拍摄太阳系外行星。”但事实上,首个拍摄到太阳系外行星的望远镜并非詹姆斯·韦伯太空望远镜,而是欧洲南方天文台于2004年安装的超大望远镜 VLT。


无线吸尘器缺点是“电源线太短”?微软必应聊天机器人也错误频出 View original image

消息传出后,谷歌母公司 Alphabet 的股价暴跌。受 Bard 发布消息刺激,股价在一天之内一度上涨近5%,随后却在人工智能聊天机器人错误答案的后续冲击下大幅下挫。有外媒报道称,谷歌内部也出现了“太草率了”“搞砸了”等一片批评声。


谷歌与微软之间的人工智能聊天机器人竞争在本月愈发激烈。获得微软投资的 OpenAI 在去年11月公开的 ChatGPT,仅用两个月时间就创下累积用户1亿人的纪录,取得巨大成功。以此为契机,舆论纷纷预测,类似 ChatGPT 的生成式(generative)人工智能将成为信息技术产业的“游戏规则改变者”。本月初,微软和谷歌分别匆忙公开了各自准备已久的人工智能聊天机器人,正式拉开竞争序幕。


不过,随着外界指出谷歌和微软开发的人工智能聊天机器人都在给出错误答案,两家公司显得有些操之过急的批评恐怕难以避免。根据美国消费者新闻与商业频道(CNBC)等报道,谷歌母公司 Alphabet 董事会主席 John Hennessy 也在前一天的一场活动中表示,谷歌在尚未完全准备就绪的情况下,为了证明自己掌握了与 ChatGPT 类似的技术而公开了 Bard,并预测生成式人工智能要真正成为现实生活中有用的工具,还需要1至2年的时间。



被称为“互联网之父”的谷歌首席互联网传道士 Vint Cerf 也在同一场活动中警告称:“不要仅仅因为这是一个‘热门话题(hot topic)’,就争先恐后地投资人工智能聊天机器人。”他在20世纪70年代参与开发了构成当今互联网基础的传输控制协议/网际协议(TCP/IP)。他表示:“所有人都在谈论 ChatGPT 或谷歌版本,但我们非常清楚,这些系统并不会始终按照我们的期望运行”,“要深入思考。对于未来将会发生什么,我们永远无法完全预见。”


本报道由人工智能(AI)翻译技术生成。

版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。

不容错过的热点