Gemini 演示视频被曝为事先剪辑作品

谷歌近日在公开大型语言模型(LLM)“Gemini”后,接连陷入性能相关争议。继有媒体指出,谷歌在发布当天演示过程中展示的视频系事先剪辑制作之后,又有意见认为,该模型对问题的回答也远未达到预期。


谷歌“Gemini”相关图片 / 图片来源 谷歌官方博客提供

谷歌“Gemini”相关图片 / 图片来源 谷歌官方博客提供

View original image

谷歌于7日(当地时间)宣布推出自称“性能最强”的人工智能模型Gemini,并在此过程中公开了一段时长6分钟的演示视频。视频中,基于Gemini的聊天机器人一边与用户对话,一边展示其识别图画和物体的能力,引发关注。例如,当有人在纸上用笔画出一只鸭子时,Gemini识别为“鸟”。


在视频里,Gemini看上去能够在极短时间内给出完美答案,但该视频实际上是事先剪辑而成。谷歌解释称,“演示并非实时进行,而是基于事先准备好的图像和文本提示制作”,“只是用来举例说明Gemini可以通过多模态功能进行交互”。


美国有线电视财经频道CNBC指出,今年年初谷歌发布作为ChatGPT对手的Bard时,就因演示中给出错误答案而遭到批评,此次视频也让人联想到当时的情形。


有意见还指出,Gemini不能对问题给出准确回答,或在涉及争议话题时选择回避。谷歌将Gemini模型分为3个版本发布,并将通用版(Pro)搭载在人工智能聊天机器人Bard上。据美国媒体《商业内幕》报道,Bard用户表示,在询问“今年奥斯卡颁奖礼上谁获得最佳男主角奖”时,Bard回答得结结巴巴;还有用户指出,它无法正确理解“请用英语以外的其他语言作答”的请求。



在有用户要求更新以色列与巴勒斯坦武装组织哈马斯之间战争局势时,Bard则表示“如需获取最新信息,请使用谷歌搜索”,并未给出具体回答。据《商业内幕》称,这与能给出详细回答的ChatGPT付费版和微软(Microsoft)必应(Bing)等竞争对手聊天机器人形成鲜明对比。


本报道由人工智能(AI)翻译技术生成。

版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。

不容错过的热点