“用日语能打败Chat GPT和ELIZA”
参数更少却大幅提升智能手机利用率

日本NTT宣布,将于明年3月把一项专门针对日语的大型多模态语言模型(LMM)生成式人工智能(AI)服务推向商业化。该服务被称为“日本版Chat GPT”,NTT宣称在参数数量远少于Chat GPT的情况下,依然可以实现相近的性能,因此外界对其能否成功高度关注。


据IT媒体《日经Cross Tech》2日报道,前一天NTT宣布,将把其自主开发的LMM“Tsuzumi”于明年3月面向企业客户及与NTT合作的公司为中心实现商用。“Tsuzumi”在日语中意为一种打击乐器鼓,据悉,该名称取自其“虽轻量但声响强劲、且易于调音”的特点。


NTT正在宣传的巨型语言模型(LLM)“Tsuzumi”。(图片来源 NTT官网提供)

NTT正在宣传的巨型语言模型(LLM)“Tsuzumi”。(图片来源 NTT官网提供)

View original image

与鼓的特点类似,NTT计划推出参数(模型参数)为70亿的“轻量版”和6亿的“超轻量版”两种Tsuzumi模型。一般而言,LMM通常使用数十亿到数千亿个参数,且普遍认为参数越多,AI性能越强。考虑到Chat GPT的参数规模为1750亿个,Tsuzumi的参数量可谓远远不及。


在压缩参数数量的同时,Tsuzumi预计仅支持日语和英语。不过,NTT表示,通过提高日语预训练数据的质量等研究工作,已将研发重点完全集中在日语性能上。


NTT称:“根据我们实施的日语性能基准测试,轻量版的表现超过了美国OpenAI开发的GPT-3.5”,“训练成本仅为GPT模型的1/25,能够大幅节省费用。”目前据悉正以赶超GPT-4为目标推进性能提升。


NTT公布的Suzumi与其他大型多模态模型在日语性能上的对比表。NTT强调Suzumi战胜了Chat GPT和Eliza。图片来源 NTT官网提供

NTT公布的Suzumi与其他大型多模态模型在日语性能上的对比表。NTT强调Suzumi战胜了Chat GPT和Eliza。图片来源 NTT官网提供

View original image

实际上,NTT正在其官方网站上宣传Tsuzumi与Chat GPT 3.5、Eliza等在日语性能方面的对比结果。根据该公司公布的数据,Tsuzumi在性能对决中战胜Chat GPT 3.5的概率为52.5%,战胜Eliza的概率为71.3%。


NTT还强调称,“轻量版本可在智能手机或智能手表上加以利用,这是其优势之一”。


该公司同时补充说:“Tsuzumi不仅能处理文字,还具备读取并理解文档中所包含的图片、表格、图表并作出回应的功能”,“今后将在视觉信息基础上,继续加入语音等信息进行训练,计划在明年4月以后提供相关功能”。



Tsuzumi自本月起已在NTT Docomo、NTT东日本等公司内外展开评测。面向企业方面,则正与京都大学医院、东京海上日动火灾保险等机构进行实证评估。社长Shimada Akira表示:“仅凭Tsuzumi一项业务,目标是在2027年实现超过1000亿日元的销售额。”


本报道由人工智能(AI)翻译技术生成。

版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。

不容错过的热点