研究结果刊登于国际学术期刊《Radiology》

医疗人工智能(AI)企业Lunit于3日表示,一项研究结果显示,只有在使用高精度AI模型时,阅片医生的检出能力才会大幅提升,该研究成果已刊登在国际学术期刊《Radiology》最新一期上。


Lunit 的胸部X光人工智能影像分析解决方案“Lunit Insight CXR”。Lunit提供

Lunit 的胸部X光人工智能影像分析解决方案“Lunit Insight CXR”。Lunit提供

View original image

《Radiology》是由美国放射学会(Radiological Society of North America, RSNA)出版的科学引文索引(SCI)级国际学术期刊,是影像医学领域具有全球权威性的期刊。


本次研究以首尔大学医院在2015年12月至2021年2月期间接受胸部X光拍摄的患者为对象,从中回顾性筛选出120名患者,由30名放射科医生参与完成。


研究团队首先在不借助AI的情况下,对共120张影像进行第一轮单独阅片,其中包括检出肺癌的胸部X光影像60张,以及无肿瘤的正常影像60张。随后,将阅片医生分为两组,每组各15人:A组使用高精度AI,B组使用低精度AI,分别进行第二轮阅片。为开展研究,A组采用了胸部X光AI影像分析解决方案“Lunit Insight CXR”的算法,B组则使用仅学习了全部训练数据10%的、相对低性能的算法。


研究结果显示,在作为人工智能模型性能评价指标的受试者工作特征曲线下面积(Area Under the Receiver Operating Characteristic, AUROC)分析中,Lunit Insight CXR算法单独检出肺癌的能力为0.88,较低性能算法的0.77展现出更高的准确度。同时,A组阅片医生在第一轮阅片后,利用Lunit Insight CXR进行第二轮阅片时,AUROC数值由0.77提升至0.82。相反,B组阅片医生在第一、第二轮阅片中AUROC均为0.75,数值上没有变化。AUROC数值越接近1,性能越优异,而达到0.8及以上时则被评价为高性能模型。


与此同时,研究还测量了当阅片医生第一轮单独阅片结果与第二轮阅片时AI给出的结果不一致时,根据AI建议修改判读结果的比例。结果显示,当第二轮出现与医生第一轮独立阅片结果相冲突的AI结果时,接受该建议并推翻最终判读的比例,A组为67%,B组为59%,表明使用高性能算法的群体对人工智能的接受度更高。


首尔大学医院放射科教授Park Changmin表示:“本次研究为分析使用AI进行第二轮阅片时准确度受到哪些因素影响,事先调查了阅片医生的从业年限、对AI的认知、AI使用与研究经验有无等情况。结果显示,只有各个阅片医生第一轮诊断的准确度以及AI本身的准确度,会对使用AI进行第二轮阅片的医疗人员准确度产生显著影响,而阅片医生自身的经验和倾向并无关联。”



Lunit代表Seo Bumseok表示:“这项研究确认了,无论个别医疗人员的特性如何,只有利用高性能AI,才能同时实现阅片改进效果并提高医疗人员对AI的接受度。今后Lunit也将继续致力于提升AI性能,以提高医疗人员的阅片准确度,并为患者提供更加准确的信息。”


本报道由人工智能(AI)翻译技术生成。

版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。

不容错过的热点