UST研究团队利用AI与深度学习开发出准确率达95%的判别技术
一旦发生交通事故或斗殴,就能立刻感知并通知人员的人工智能(AI)闭路电视(CCTV)监控技术已经被开发出来。
科学技术联合大学院大学(UST)8日表示,在韩国电子通信研究院(ETRI)学院就读的Kim Hyeongmin、Jeon Hobum博士课程研究生,开发出了能够对多种异常情况进行复合检测和判断的一体化框架技术。
这项技术是目前国内唯一一项通过韩国互联网振兴院(KISA)七大类智能CCTV认证领域——“徘徊、入侵、倒地、斗殴、遗弃、纵火、营销”全部项目的技术。在新加坡南洋理工大学(NTU)构建的全球最大三维视觉数据集(DB)“RGB+D”基准性能评估中,该技术的行为识别率达到94.66%,被确认具备世界最高水平的异常行为检测精度。尤其是在雾天、下雪、夜间等多种外部环境下,也能准确感知人的动作和异常行为。
在首尔市,一个监控人员平均要负责958台CCTV,韩国目前监控条件十分恶劣,甚至出现了CCTV“无用论”的说法。借助这项技术,有望在以少量人力大幅提升异常行为感知能力等方面产生巨大带动效应。
智能CCTV已经被用于构建社会安全网的七大主要情景探测。但目前大多数技术仅针对单一异常情况进行了最优化的检测方法开发,无法对不同情景进行复合检测和处理,导致实用性不高。而此次技术则可以让计算机主动感知复合发生的异常情况并通知监控人员,从而以较少人力实现高效的监控中心运营。
该技术采用将视觉人工智能与语言人工智能相结合的方式,引入了“零样本学习(Zero-shot Learning)方法”,使计算机能够基于系统经验自行组合信息并推理得出结果。通过在推理过程中设定并分析探测情景的人工智能(AI)技术,提高了大数据构建的时间与成本效率以及技术应用效率。这一方法属于能够用人类语言对图像进行分类的“后深度学习(Post Deep Learning)”技术,是通过比较视觉信息与语言信息的共通点来找出正确答案的学习方式。美国人工智能公司OpenAI开发的图像生成人工智能“DALL-E”就应用了这一方法。系统在同时区分图像和文本的基础上,依据语言信息自我学习如何生成图像,之后在输入新的文本请求时,能够依托语言信息自行组合并生成新的图像。
该技术还可与物联网(IOT,Internet of Things)技术相结合,在无人店铺内滋事、独居老人晕倒、遗弃宠物等异常情况发生时,立即向监控人员发出警报,可在多种CCTV环境中广泛应用于灾害预防、安全设施监视等日常生活的各个方面,具有极高的应用价值。在纵火情景下,该技术不是基于传统的“火灾区域”物体检测,而是可同时探测火灾画面(烟雾、火焰等)以及人的纵火行为(泼洒汽油、点火等),在火势大面积蔓延之前(10秒内)及纵火阶段就能感知异常行为并向监控人员发出警告,预计将对预防大型火灾和山火大有裨益。
该系统还能探测特定空间内的人口过密情况。一旦出现超过一定水平的人口过密,就可以向监控人员或管理者通报情况,不仅有助于事故预防,也可用于分析消费者行为模式。例如,当大型超市内结账柜台前顾客突然聚集时,可以追加投入收银员;或分析超市内特定区域顾客扎堆的情况,从而用于营销。
截至2019年12月31日,我国公共机构安装的CCTV数量约为114万台,并在持续增加,其中51.6%用于犯罪预防目的,43.8%用于设施安全及火灾预防。然而,即便在安全设施乃至街巷都安装了CCTV,由于监控中心人手不足,错过灾害预防黄金时间的情况屡见不鲜。行政安全部将每名监控人员负责的CCTV数量适正水平设定为最多50台,但现实中却高达271.88台,远超标准。
在目前依赖人眼的传统监控条件下,不但难以指望事故预防,连即时应对也十分困难,CCTV往往沦为“事后补救”的工具。此次技术作为一种为现有CCTV赋予实时预防能力的平台升级型AI技术,具有重要价值。
该技术不仅可用于实时视频,也可在已拍摄的视频中进行异常情况探测。在从大量CCTV拍摄资料中寻找犯罪证据时,以往需要警方人员通看全部视频以找出嫌疑点,而运用本技术后,系统能够自动分析视频,预计将大幅提升刑事侦查效率。
由于在现实生活中具有很高的适用性,目前已实现1项研究所企业技术出资、1项技术转让、2篇国际学会论文发表,并在进行国内专利申请和国际专利申请审查,未来有望持续创造附加价值。到2020年为止,视频监控市场规模在全球为53万亿韩元,国内为3兆9144亿韩元。预测到2027年,全球市场将达146万亿韩元,国内将达5兆4672亿韩元规模(Transparency Market Research与Human ICT预测)。2020年至2025年年均增长率预计将达到约16.8%。
版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。