日本NTT：“日语专用ChatGPT ‘Tsuzumi’ 将于明年3月推出”

by Jeon Jinyoung

Published 02 Nov.2023 16:00(KST)

“用日语能打败Chat GPT和ELIZA”
参数更少却大幅提升智能手机利用率

日本NTT宣布，将于明年3月把一项专门针对日语的大型多模态语言模型（LMM）生成式人工智能（AI）服务推向商业化。该服务被称为“日本版Chat GPT”，NTT宣称在参数数量远少于Chat GPT的情况下，依然可以实现相近的性能，因此外界对其能否成功高度关注。

据IT媒体《日经Cross Tech》2日报道，前一天NTT宣布，将把其自主开发的LMM“Tsuzumi”于明年3月面向企业客户及与NTT合作的公司为中心实现商用。“Tsuzumi”在日语中意为一种打击乐器鼓，据悉，该名称取自其“虽轻量但声响强劲、且易于调音”的特点。

NTT正在宣传的巨型语言模型（LLM）“Tsuzumi”。（图片来源 NTT官网提供）

与鼓的特点类似，NTT计划推出参数（模型参数）为70亿的“轻量版”和6亿的“超轻量版”两种Tsuzumi模型。一般而言，LMM通常使用数十亿到数千亿个参数，且普遍认为参数越多，AI性能越强。考虑到Chat GPT的参数规模为1750亿个，Tsuzumi的参数量可谓远远不及。

在压缩参数数量的同时，Tsuzumi预计仅支持日语和英语。不过，NTT表示，通过提高日语预训练数据的质量等研究工作，已将研发重点完全集中在日语性能上。

NTT称：“根据我们实施的日语性能基准测试，轻量版的表现超过了美国OpenAI开发的GPT-3.5”，“训练成本仅为GPT模型的1/25，能够大幅节省费用。”目前据悉正以赶超GPT-4为目标推进性能提升。

NTT公布的Suzumi与其他大型多模态模型在日语性能上的对比表。NTT强调Suzumi战胜了Chat GPT和Eliza。图片来源 NTT官网提供

实际上，NTT正在其官方网站上宣传Tsuzumi与Chat GPT 3.5、Eliza等在日语性能方面的对比结果。根据该公司公布的数据，Tsuzumi在性能对决中战胜Chat GPT 3.5的概率为52.5%，战胜Eliza的概率为71.3%。

NTT还强调称，“轻量版本可在智能手机或智能手表上加以利用，这是其优势之一”。

该公司同时补充说：“Tsuzumi不仅能处理文字，还具备读取并理解文档中所包含的图片、表格、图表并作出回应的功能”，“今后将在视觉信息基础上，继续加入语音等信息进行训练，计划在明年4月以后提供相关功能”。

Tsuzumi自本月起已在NTT Docomo、NTT东日本等公司内外展开评测。面向企业方面，则正与京都大学医院、东京海上日动火灾保险等机构进行实证评估。社长Shimada Akira表示：“仅凭Tsuzumi一项业务，目标是在2027年实现超过1000亿日元的销售额。”

本报道由人工智能(AI)翻译技术生成。