谷歌 AI“Gemini”演示视频引发争议，性能遭连番质疑

by Kim Pyeonghwa

Published 09 Dec.2023 09:56(KST)

Gemini 演示视频被曝为事先剪辑作品

谷歌近日在公开大型语言模型（LLM）“Gemini”后，接连陷入性能相关争议。继有媒体指出，谷歌在发布当天演示过程中展示的视频系事先剪辑制作之后，又有意见认为，该模型对问题的回答也远未达到预期。

谷歌“Gemini”相关图片 / 图片来源谷歌官方博客提供

谷歌于7日（当地时间）宣布推出自称“性能最强”的人工智能模型Gemini，并在此过程中公开了一段时长6分钟的演示视频。视频中，基于Gemini的聊天机器人一边与用户对话，一边展示其识别图画和物体的能力，引发关注。例如，当有人在纸上用笔画出一只鸭子时，Gemini识别为“鸟”。

在视频里，Gemini看上去能够在极短时间内给出完美答案，但该视频实际上是事先剪辑而成。谷歌解释称，“演示并非实时进行，而是基于事先准备好的图像和文本提示制作”，“只是用来举例说明Gemini可以通过多模态功能进行交互”。

美国有线电视财经频道CNBC指出，今年年初谷歌发布作为ChatGPT对手的Bard时，就因演示中给出错误答案而遭到批评，此次视频也让人联想到当时的情形。

有意见还指出，Gemini不能对问题给出准确回答，或在涉及争议话题时选择回避。谷歌将Gemini模型分为3个版本发布，并将通用版（Pro）搭载在人工智能聊天机器人Bard上。据美国媒体《商业内幕》报道，Bard用户表示，在询问“今年奥斯卡颁奖礼上谁获得最佳男主角奖”时，Bard回答得结结巴巴；还有用户指出，它无法正确理解“请用英语以外的其他语言作答”的请求。