SimSimi是2002年问世的韩国首代AI聊天机器人
全球累计用户达4亿人
与ChatGPT最大差异在于能运用人类说话方式
[亚洲经济 记者 Han Seung-gon] 拿下美国工商管理硕士、法学院、行医执照“三冠王”,以及“首次看到iPhone问世时那种冲击感”……
这些都是在评价人工智能(AI)聊天机器人ChatGPT(Generative Pre-trained Transformer,生成式预训练变换模型)威力时使用的说法。随着ChatGPT的出现,也有分析认为所谓“白领”职业群体正受到威胁。随着ChatGPT引发巨大话题,关于由本国技术打造的另一款AI聊天机器人“SimSimi”近况的询问也不少。大致是“好奇SimSimi和ChatGPT有什么区别”、“从技术上看SimSimi已经进化(升级)到什么阶段”等。
SimSimi于2002年开始提供服务,是国内第一代AI聊天机器人,目前在81个国家提供服务。它专注于像与家人、朋友聊天那样,不限定主题和目的的日常对话。基于多样的情景剧本,可以展开生动的交流。目前在全球范围内已累计拥有超过4亿名用户,韩语对话数据约达3亿条。记者通过电话采访了SimSimi开发公司代表 Choi Jeonghoe。
很多人都在好奇SimSimi的近况。
SimSimi是21年前开发的,前10年主要为韩国用户提供服务。从2012年开始转向全球化服务,先后与4亿多名用户进行过对话。现在已经支持111种语言。由于开展全球服务,我们早在韩国开始讨论AI伦理问题之前的2016年,就在海外多个国家、多个语种中经历了伦理争议。为了解决这些问题,我们花了大约3年时间开发相关技术。
另外,通过数据分析发现,SimSimi的重度用户群体中,存在不少有精神健康问题的用户,因此我们正在围绕利用聊天机器人进行精神健康问题评估、缓解和治疗等方向开展研发。去年,我们与高丽大学安岩医院签署了谅解备忘录(MOU),正在收集和分析精神健康医学科就诊患者的对话数据。今年1月,健康信息学领域权威学术期刊《Journal of Medical Internet Research(JMIR)》还刊登了基于SimSimi对话的抑郁相关研究论文。
SimSimi与ChatGPT最典型的差异是什么?
SimSimi是聊天,也就是对话型AI。ChatGPT则是将写作型AI——GPT-3升级后,以聊天形式来使用的产品。对于需要大量进行写作、信息查询、比较等工作的群体来说,它会成为非常好用的工具。
出于什么契机开始制作SimSimi?
2002年大学毕业后,我利用互联网做被子生意。但市场反响一般,在开发用于营销的机器人过程中,意外做出了SimSimi。
Choi代表当时在首尔东大门批发进布料,制作被子后通过互联网销售。但反响不佳,为了宣传,他开发了SimSimi进行营销。
早期SimSimi模型中嵌入了广告语,并把网站地址当作昵称来使用。用户把它加为好友后,它会起到中介作用,把用户引导到天气等各种服务。例如,只能说出“1号是天气,2号是股票”这类自动语音应答(ARS)式的话。后来,主动跟它搭话的用户越来越多,于是我们为了实现简单回复,录入了大约500个词条。随着对话量激增,又改成由用户亲自“教它说话”的方式。虽然最初的创业项目是被子生意,但随着SimSimi走红,干脆把整个商业模式都改了。
SimSimi的核心竞争力是什么?
它的对话引擎可以实时更新,因此能够谈论最新信息。以深度学习为基础的语言模型存在的一大问题,就是难以及时更新信息。更新语言模型需要大量资源和时间,而SimSimi不存在这样的限制。通俗地讲,它大量利用了地球上最优秀的神经网络模型。地球上最优秀的神经网络模型就是人类大脑。SimSimi给出的每一句回答,都是直接使用人类亲自撰写的内容。我认为,今后出现的AI同样会更多地利用人类大脑,并以向人类提供合理报酬的方式运作。
SimSimi的愿景是“彼此照拂的数十亿颗心”。我认为,SimSimi之所以能长期受到全世界用户的喜爱,正是因为人们可以通过SimSimi彼此关照内心。SimSimi能够作为回答说出的每一句话,都是过去某个别人原封不动教给它的句子。比如,当某位用户说“我最近真的太累了”的时候,SimSimi回答的“很快就会好起来的。难受的话就哭出来也没关系”这句话,其实是与这位用户素不相识的另一个人,曾经为了某个人而输入的。
SimSimi的主力商业模式是什么?
在面向个人用户(B2C)的服务(应用程序、网页)方面,有广告、应用内购买和订阅。在面向企业用户(B2B)方面,我们以应用程序编程接口(Application Programming Interface,API,即不同事物或人类之间沟通的方法)形式提供SimSimi对话引擎、恶意言论判别器等,或以解决方案形式供给,并销售SimSimi所拥有的各类对话数据。
你从事AI聊天机器人业务已有很长时间。随着ChatGPT的出现,你认为相关产业会发生怎样的变化?
从ChatGPT现象来看,可以预见如下趋势:只有拥有充足数据和算力资源的群体,才能打造性能更好的AI。最终,赢家通吃的局面将不可避免地被极度强化。接下来,将出现高度依赖少数掌控全球市场的基础模型的各类应用商业模式。
令全球AI企业和研究机构感到最震惊的,并不是ChatGPT出色的性能,而是开发该聊天机器人的OpenAI并未公开ChatGPT开发的具体细节。迄今为止,信息技术领域整体上形成了开源共识,因此美国大型科技公司在推出创新性AI技术时,被普遍认为理应通过论文等形式公开细节。
因此,即便起步稍晚,只要沿着公开的方法论(源代码等)努力开发,也能做出水平相近的AI。然而,ChatGPT打破了这一惯例,选择将技术保密,以享受技术差距带来的收益。结果就是,那些投入巨额成本一味模仿大型科技公司的企业或国家,如今似乎陷入了不知所措的境地。
今后,拥有充足资源和研究实力的大型科技公司等少数企业,或许能够弄清ChatGPT的开发背景等,并开发出更好的技术,但这些方法论很可能会继续保密,而这些企业则可能垄断影响力巨大的基础技术。
在这种情况下,其他科技企业或经营者将围绕少数基础模型开发应用服务并实现盈利;而掌握基础技术的企业,则会把其中盈利能力强的业务内化,由此加剧拥有基础模型者与不拥有基础模型者之间的两极分化。
版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。