新AI模型popEVE问世,精准锁定致病突变突破罕见病诊断瓶颈
面对人体内数万个遗传变异,科学家们终于找到了从海量数据中快速定位致病“元凶”的新方法。
每人的基因组中都存在数万个小遗传变异,但只有极少数会真正导致疾病。如何从这些“大海”中准确找出致病的“针”,一直是遗传医学领域的巨大挑战。
现有诊断工具大多只能判断变异是否危险,却难以评估其危害程度,导致许多罕见病患者多年无法确诊。
如今,哈佛大学医学院与西班牙巴塞罗那基因组调控中心开发的AI模型popEVE,通过结合进化数据和人类群体遗传信息,不仅能识别致病突变,还能对其危害程度进行排序,为快速诊断罕见遗传疾病带来新的突破。
01 遗传诊断的困境:海量变异与稀少答案
在基因组学快速发展的今天,基因测序技术已能轻松检测出人类DNA中的数万个微小遗传变异。
这些变异中,错义突变——即改变蛋白质单个氨基酸的变异——占据了相当比例。
大多数这类突变无害,但少数可能引发严重疾病,而真正的挑战在于如何准确区分良性变异与有害变异。
更为复杂的是,有害突变的影响程度各不相同:有的仅引发轻微症状,有的导致严重残疾,有的甚至在儿童期就危及生命。
面对这些情况,现有AI工具大多只能预测突变是否危险,却难以评估危害程度,导致许多患者长期无法获得明确诊断。
02 popEVE的创新:进化智慧与人类数据的融合
popEVE的研发基于数十万个不同物种的进化数据及全人类群体的遗传变异信息。
这种庞大的进化记录使该工具能解析约2万多种人类蛋白质的关键区域与可变异区域。
popEVE并非从零开始构建,而是基于哈佛大学Marks实验室几年前开发的生成式AI模型EVE的升级。
最初的EVE模型使用深度进化信息学习不同物种中高度保守的突变模式,能预测人类基因变异如何影响蛋白质功能。
但EVE存在明显局限——它无法轻松比较不同人类基因上的变异,以确定哪些可能对健康最有害。
为克服这一局限,研究团队在EVE基础上增加了两个关键组件:大型语言蛋白质模型和人类群体数据。
前者从构成蛋白质的氨基酸序列中学习,后者捕捉自然遗传变异。
03 技术突破:跨基因比较与危害程度排序
popEVE的核心优势在于它能将变异放在一个连续谱系上进行评估。
它为每个变异生成一个分数,表示其引起疾病的可能性,使研究人员能够直接比较不同基因上的变异。
这种能力源自popEVE整合了跨物种和物种内信息的双重优势,既揭示了变异影响蛋白质功能的程度,也显示了该变异对人类生理的重要性。
研究团队表示,popEVE不会因为遗传背景不同而表现出祖先偏见,在代表性不足的人群中表现同样出色,不会过度预测致病性变异的普遍性。
与现有工具相比,popEVE在多个方面展现出显著进步。在测试中,它成功区分了致病变异和良性变异,分辨了健康对照者和患有严重发育障碍的患者。
它还能确定一个变异是可能导致儿童期还是成年期死亡,甚至评估一个改变是遗传性的还是随机发生的,无需父母的遗传信息。
04 临床验证:诊断率提升与新致病基因发现
为验证模型效能,团队分析了超过3.1万个患有严重发育障碍的儿童家庭遗传数据。
这些疾病原本被假设是由单一变异引起的,但具体的致病变异一直未被找到。
分析结果令人振奋——popEVE成功在大约三分之一的病例中实现了诊断。
在98%的病例中,popEVE将共同突变标记为最具破坏性的变异,其表现优于包括DeepMind公司AlphaMissense在内的同类先进工具。
更值得注意的是,popEVE发现了123个此前被认为与发育障碍无关的基因与这些疾病有关联—— essentially找到了这些障碍的可能遗传原因。
其中25个基因已被其他实验室的研究独立证实确实会导致这些疾病。
05 现实应用:从实验室到临床的转变
目前,popEVE正在从研究工具向临床应用转变。
科学家可通过在线门户网站访问popEVE,研究团队也正与多家机构合作,包括波士顿儿童医院的儿童罕见疾病协作组、费城儿童医院人类遗传学部,以及基因组英格兰与韦尔科姆桑格研究所的合作项目。
现实世界的应用已经展开——西班牙巴塞罗那的一位临床研究人员一直在使用popEVE解读患者的变异信息,这些信息已帮助他做出了多个罕见病诊断。
研究人员强调,虽然popEVE在广泛用于临床前仍需进一步验证以确保其安全性和准确性,但他们希望该工具能最终提高临床医生使用计算模型进行遗传诊断的信心。
06 未来前景:超越诊断的潜力
popEVE的潜力不仅限于诊断领域。
研究团队正在将popEVE分数整合到现有的变异和蛋白质数据库中,如ProtVar和UniProt,这将使全球科学家能够使用该模型比较不同基因的变异。
通过精确定位罕见或复杂疾病的遗传起源,popEVE可能为药物开发识别新的靶点和途径。
popEVE代表了哈佛医学院社区广泛努力的一部分,这些努力旨在进行研究、构建AI工具,并参与全国性合作,以改进罕见病的诊断和治疗。
popEVE模型正在临床现场进行测试,以验证它是否能像研究结果所示的那样,快速准确地诊断罕见单变异遗传疾病。
西班牙巴塞罗那的一位临床研究人员已经使用popEVE解读患者的变异信息,成功实现了多个罕见病诊断。
随着该工具在更多临床环境中的验证,popEVE有望结束无数罕见病患者及其家庭的“诊断之旅”。
对于罕见病群体来说,这种从数据到诊断的转变意味着等待时间的缩短和治疗希望的增大。
|
|