Lunit：“利用高性能AI可提升阅片者肺癌检出能力”

by Lee Myeonghwan

Published 03 Jul.2023 09:50(KST)

研究结果刊登于国际学术期刊《Radiology》

医疗人工智能（AI）企业Lunit于3日表示，一项研究结果显示，只有在使用高精度AI模型时，阅片医生的检出能力才会大幅提升，该研究成果已刊登在国际学术期刊《Radiology》最新一期上。

Lunit 的胸部X光人工智能影像分析解决方案“Lunit Insight CXR”。Lunit提供

《Radiology》是由美国放射学会（Radiological Society of North America, RSNA）出版的科学引文索引（SCI）级国际学术期刊，是影像医学领域具有全球权威性的期刊。

本次研究以首尔大学医院在2015年12月至2021年2月期间接受胸部X光拍摄的患者为对象，从中回顾性筛选出120名患者，由30名放射科医生参与完成。

研究团队首先在不借助AI的情况下，对共120张影像进行第一轮单独阅片，其中包括检出肺癌的胸部X光影像60张，以及无肿瘤的正常影像60张。随后，将阅片医生分为两组，每组各15人：A组使用高精度AI，B组使用低精度AI，分别进行第二轮阅片。为开展研究，A组采用了胸部X光AI影像分析解决方案“Lunit Insight CXR”的算法，B组则使用仅学习了全部训练数据10%的、相对低性能的算法。

研究结果显示，在作为人工智能模型性能评价指标的受试者工作特征曲线下面积（Area Under the Receiver Operating Characteristic, AUROC）分析中，Lunit Insight CXR算法单独检出肺癌的能力为0.88，较低性能算法的0.77展现出更高的准确度。同时，A组阅片医生在第一轮阅片后，利用Lunit Insight CXR进行第二轮阅片时，AUROC数值由0.77提升至0.82。相反，B组阅片医生在第一、第二轮阅片中AUROC均为0.75，数值上没有变化。AUROC数值越接近1，性能越优异，而达到0.8及以上时则被评价为高性能模型。

与此同时，研究还测量了当阅片医生第一轮单独阅片结果与第二轮阅片时AI给出的结果不一致时，根据AI建议修改判读结果的比例。结果显示，当第二轮出现与医生第一轮独立阅片结果相冲突的AI结果时，接受该建议并推翻最终判读的比例，A组为67%，B组为59%，表明使用高性能算法的群体对人工智能的接受度更高。

首尔大学医院放射科教授Park Changmin表示：“本次研究为分析使用AI进行第二轮阅片时准确度受到哪些因素影响，事先调查了阅片医生的从业年限、对AI的认知、AI使用与研究经验有无等情况。结果显示，只有各个阅片医生第一轮诊断的准确度以及AI本身的准确度，会对使用AI进行第二轮阅片的医疗人员准确度产生显著影响，而阅片医生自身的经验和倾向并无关联。”