破解“生命密码”,为查明疾病成因和新药研发开辟新路径
去年,凭借用于蛋白质结构预测的人工智能(AI)“AlphaFold”,在科学界引领创新并获得诺贝尔化学奖的谷歌DeepMind,如今又向基因解析这一另一重大难题发起挑战。外界期待这一成果将在疾病诊断、治疗方法以及新药开发方面产生巨大影响。
谷歌DeepMind于当地时间26日通过论文介绍了利用人工智能破解DNA秘密的“AlphaGenome”,并以科研用应用程序接口(API)的形式对外公开。任何人都可以将AlphaGenome下载用于非商业目的。
AlphaGenome可以预测DNA的微小变化会对诸如基因活性增减等各种分子过程产生何种影响。它最多可接收100万个DNA碱基字符作为输入,并在1秒内预测与基因调控相关的数千种分子特性。
正如AlphaFold揭示蛋白质三维结构,改变了生命科学研究版图一样,有观点认为,AlphaGenome将成为解开隐藏在99%基因组中的秘密的钥匙,从而开启基因组学的新时代。
基因组(Genome)是指导生物体外形、功能、生长等几乎一切特征的“细胞说明书”。DNA承载着人类的遗传信息。尽管人类基因组计划已于2003年绘制出人类基因组图谱,但要弄清多达31亿个DNA序列变异在分子层面如何发挥作用,长期以来仍是一个谜团。AlphaGenome正是为破解这一谜团而开发的。
DeepMind将目光投向负责开启与关闭基因开关的“调控基因组(regulatory genome)”。调控基因组一旦发生变异,可能成为癌症、糖尿病、心脏病、自身免疫性疾病等诸多疾病的根源,但调控基因组的“语言”极其复杂而庞大,理解其功能一直是现代遗传学面临的最大课题之一。
AlphaGenome是一种学习了DNA“语法”的“大型语言模型(Large Language Model)”。公司方面介绍称,正如ChatGPT利用“Transformer”结构,通过人类语言数据学习语法与语境一样,AlphaGenome也通过学习海量DNA序列数据,掌握了基因调控的“语法”。
谷歌DeepMind表示,AlphaGenome展现出优于既有任何预测模型的性能,并新发现了此前尚未被识别的数十万个潜在调控元件。
谷歌DeepMind负责研究的副总裁Pushmeet Kohli表示:“我们首次构建了一个能够整合理解基因组过程中各种难题的单一模型。”
谷歌DeepMind还补充称,今后计划公开AlphaGenome的全部细节,并在探索让生物技术企业能够将其用于商业用途的方案。
版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。