利用LLM将段落式检查结果转化为标准化数据
疾病管理厅国立保健研究院11日表示,已确认一项利用人工智能(AI)技术,将以段落形式撰写的冠状动脉造影检查记录自动转换为标准化数据的技术。
在国立保健研究院的支持下,延世大学医学院与国民健康保险公团一山医院共同研究团队开展了本次研究。研究的核心在于,利用大型语言模型(Large Language Model)技术,将医务人员自由撰写的检查记录转化为可直接用于分析的结构化数据。
冠状动脉造影报告虽然包含心血管疾病诊断和治疗所需的关键信息,但大多以非结构化的叙述方式撰写,难以用于大规模研究或政策分析。因此,心脏内科专科医生不得不亲自阅读数千份冠状动脉造影记录,并以手工方式整理所需信息,存在明显局限。
为此,研究团队开发了利用ChatGPT、Gemini等大型语言模型的自动结构化技术。第一阶段,利用大型语言模型将段落形式的报告转换为由心脏内科专科医生设计的标准化结构;第二阶段,在结构化数据基础上应用规则型算法,自动提取病变部位、支架信息、复杂手术与否等12项核心临床指标。
通过这一过程,原先以段落形式记录的冠状动脉造影报告被自动整理为可即时分析的表格型数据。
在验证自动结构化数据的准确度时发现,主要项目的准确度达到96%至99%的高水平。部分指标的准确度甚至高于专科医生的手工整理,证明了其在临床研究中的应用可能性。
本次研究结果已刊登于国际学术期刊《Scientific Reports》。
国立保健研究院院长Nam Jaehwan表示:“通过本次成果,预计在心血管疾病相关的大规模流行病学研究和临床试验受试者筛选等方面,医疗数据的利用将更加便捷”,并评价称:“尤其是与国立保健研究院正在推进的性别医学研究相结合,将有助于强化考虑性别特征的心血管疾病研究基础。”
疾病管理厅厅长Lim Seungkwan表示:“通过实现医疗记录清洗过程的自动化,研究和政策制定的效率将大幅提升。”
版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。