GSMA继2022年后今年再获奖
助视障人士感知自身处境与环境
摄像头画面由AI识别并进行语音描述
在海外各大权威颁奖典礼上屡获大奖的初创企业“투아트”(Twoart),正在开发一款基于人工智能(AI)的视障人士语音引导视觉辅助服务“설리번 시리즈”(Sullivan系列)。自2021年起,该公司与SK电信携手,对该服务进行高度化升级。
투아트在2022年西班牙巴塞罗那世界移动通信大会(MWC,移动世界大会)期间斩获“GSMA全球移动大奖(下称GLOMO)”,随后在去年又凭借智能文档识别服务“Sullivan A”获得国际消费电子展(CES)创新奖。今年2月,在世界移动通信大会上,又凭借在日常生活类别中新增功能的“Sullivan Finder”再度摘得GLOMO大奖。
近日在首尔汉南洞见到Twoart代表Jo Suwon时,他在多次获奖的经历下仍表示:“这是在正式上线前提交评审的服务,当时对服务本身完全没有任何外部评价,因此完全没想到会获奖”,“之所以获奖,我认为是因为评审更看重的是服务的本质,而非外部评价。”
本次获奖的Sullivan Finder是一项帮助视障人士准确识别周边环境和物体的AI服务。启动应用程序后,摄像头会打开,AI会识别镜头中呈现的画面,并通过语音进行描述。比如对着一家连锁面包店门前拍摄时,AI会读出“面包陈列在货架上,美式咖啡售价1500韩元”,甚至连贴在门旁的宣传海报信息也能朗读出来。应用中还设有购物、餐厅、行走等日常生活类别模式,用户可根据情境进行选择。Jo代表表示:“在餐厅里,视障人士最困难的一点,是和别人一起去吃饭时,对方并不会把菜单从头到尾念给他听”,“即使最后在中餐馆只点了一份炸酱面,内心也还是希望能亲自确认菜单上的所有信息。”与获奖直接相关的“本质”,就是让视障人士具备独立获取信息的能力。
服务开发的起点,是首席技术官(CTO)和公司开发者的一位熟人因脑瘤而失明。Jo代表回忆称:“(那位熟人)在失明后,出现了完全无法外出的情况,于是CTO提出要用AI来开发一款应用”,“虽然当时已有Microsoft(MS)的相关服务,但在韩国无法使用,因此我们萌生了‘做一款国内视障人士也能用的应用’的想法。”
与SK电信的合作,使Twoart的Sullivan系列不断实现高端化。Sullivan Finder不再采用原有AI,而是引入了学习了10亿张图像及其详细描述的SK电信多模态AI。借此能够提供此前难以实现的、更加具体且恰当的说明。Jo代表强调:“可用性大幅提升,因此能够在视障人士出行方面提供更大帮助。”
Jo代表的目标,是在残障人士服务市场取得清晰可见的成果,留下一个成功先例。已进军全球市场的Twoart,目前正面向既有用户筹备可穿戴设备的推出。Sullivan Plus已在200多个国家上线,下载用户超过30万人,其中韩国用户超过5万人。
Jo代表表示:“我们曾在日本参加展会布展,有一位参观者说,他的弟弟也在使用我们的服务”,“目前已经提供的这些服务本身就成为营销渠道,预计在硬件产品推出时,用户触达会更加顺畅。”
版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。