仿真驱动的数字孪生解决方案企业EAIT于13日表示,已从韩国电子通信研究院(ETRI)引进了用于自动驾驶的基于VLM(视觉语言模型)的多目标追踪技术。
VLM技术是将计算机视觉与自然语言处理相结合、可实时进行多目标检测与追踪的先进技术,通过融合用户输入的文本信息与视频,可高精度地追踪目标。既有的目标检测与追踪技术主要围绕预先定义的特定对象运行,存在局限;而基于VLM的技术则可解析用户以文本输入的信息,动态检测并追踪所需目标,其灵活性是最大特点。
近期,利用实时流媒体视频数据的各类应用服务需求不断增加。尤其是基于视频数据的高精度目标检测与追踪技术,已成为安防监控、交通、安全、制造、智慧城市等多种产业领域的核心要素。
目前,国内研究机构及高校正积极开展视觉语言模型研究,以及其在自动驾驶和安防系统中的应用研究。在医疗、安防、制造业等领域,也正在开发相关商用化技术。
EAIT相关负责人表示:“通过VLM技术的商用化,我们将率先在当前筹备中的智慧城市自动驾驶服务中引入这一技术,从而在融合实时流媒体数据与人工智能的下一代视频分析市场中取得竞争优势”,并称“今后还计划将其应用拓展至基于数字孪生的智能制造、物流等领域,以进一步扩大公司的业务版图”。
本报道由人工智能(AI)翻译技术生成。
版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。