KAIST开发出一套可自动提取生物通路信息的人工智能框架。用于表达基因、蛋白质、代谢物等信息的生物通路图像蕴含重要研究成果,但此前针对图像基础信息进行提取的研究一直相对不足。本次研究正是在这一背景下具有重要意义。


KAIST表示,生物化学工程系Kim Hyeonuk教授研究团队开发出一种基于机器学习的“生物通路信息提取框架(Extraction of Biological Pathway Information,以下简称EBPI)”,可从生物通路图像中自动提取基因和代谢物信息,此消息于28日公布。


(从左起)KAIST 生命化学工程学系博士研究生 Kwon Moonsoo、博士研究生 Lee Junkyu、教授 Kim Hyunwook。KAIST 提供

(从左起)KAIST 生命化学工程学系博士研究生 Kwon Moonsoo、博士研究生 Lee Junkyu、教授 Kim Hyunwook。KAIST 提供

View original image

EBPI能够识别文献中提取的图像里的箭头和文本,并在此基础上将生物通路重构为可编辑的表格形式。其通过对象检测模型等机器学习方法,在通路图像中检测箭头的位置和方向,然后将图像中的文本分类为基因、蛋白质和代谢物等。此外,将提取的信息进行整合并以表格形式提供通路信息,是EBPI的主要功能。


研究团队还将从7万4853篇论文中提取的生物通路图像与既有的人工绘制通路图进行比较,对EBPI的性能进行了验证。结果表明,该系统能够以较高的准确度自动提取生物通路信息。


从生物通路图像中自动提取生化反应信息的EBPI示意图。KAIST提供

从生物通路图像中自动提取生化反应信息的EBPI示意图。KAIST提供

View original image

尤其是,研究团队还成功利用EBPI,从大量文献中的生物通路图像中提取出典型生物通路数据库中尚未收录的生化反应信息。用EBPI分析与具有产业价值的代谢物生物合成相关文献后发现,文献中已有报道但既有数据库中却被遗漏的生化反应。


负责统筹本次研究的Kim Hyeonuk教授表示:“EBPI将在大规模文献数据分析过程中成为一项重要工具。这是生命工学、代谢工程及合成生物学领域首次利用人工智能分析生物通路图像的案例,预计将在相关研究的实验设计与分析中得到有益应用。”


另外,研究团队在科学技术信息通信部韩国研究财团以及农村振兴厅农业微生物事业团的支持下开展了本项研究。



KAIST生物化学工程系博士研究生Kwon Munsu和博士研究生Lee Jungyu以共同第一作者身份参与的此次研究,已刊登在代谢工程及合成生物学领域的代表性国际学术期刊《代谢工程(Metabolic Engineering)》11月刊上。


本报道由人工智能(AI)翻译技术生成。

版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。

不容错过的热点