半岛全站近年来,针对转录和表观遗传相关疾病的新型治疗策略展现出相当大的潜力,表观遗传类靶标被认为是未来十年里最具有前景性的一类药靶半岛全站。但是,这类靶标功能相关性复杂,结构在其催化结构域或蛋白互作结构域则可能高度保守,带来小分子抑制剂的选择性机制不明确、特定的表型与特定的蛋白活性联系困难等挑战。因此,活性分子表观遗传靶标谱预测(Epigenetic target profiling)在高选择性的表观遗传药物(epi-drugs)开发早期阶段扮演着非常重要的角色。精确预测表观遗传靶标谱有助于明确药物选择性,阐明药物脱靶效应副作用以及药物重定位等。然而,现有的预测方法由于数据量和算法限制,其预测精度不能满足相关药物开发的需求。
来自浙江大学和澳门理工大学的研究团队基于多任务学习、对比学习和自适应学习等新一代AI技术,开发了一种用于表观遗传靶标谱预测的模型——AMGC,相较于其他测试方法展现出了更强大的预测性能和一定的可解释性,有望通过用户友好的在线网站方便研究者进行表观遗传靶标谱的预测工作()。本文于2月28日以“AMGC a multiple-task graph neutral network for epigenetic target profiling”为题在Cell Press细胞出版社旗下期刊Cell Reports Physical Science在线发表。
在AMGC模型中,目标分子首先被表征成为图的形式,进入数个图卷积层进行信息的加工和传递,再经过注意力机制层融合不同原子的信息,最后进入多任务的全连接层来预测最终结果。此外,AMGC引入了对比学习和自适应学习等机制,来增强模型的泛化性能。内部测试集和外部测试集上的预测结果显示,AMGC均取得了优于传统描述符加经典机器学习算法半岛全站,以及基于其它图神经网络的多任务模型。
AMGC可以通过提取每个原子对预测结果的贡献权重来显示其可解释性。如图2a所示,JAK1靶标结构中残基LEU-932中的氧原子和氮原子与化合物1~4中的氮原子形成氢键,残基ASP-994与化合物3的羟基形成氢键。AMGC可以突出显示这四个化合物中形成氢键的原子。此外,与前三个化合物相比,化合物4用于形成氢键的极性基团较少,因此其被预测为活性的概率也最小半岛全站。在图4b中,LSD1靶标结构中的ASP-555残基可以与其内源性分子六元环上的氨基形成盐桥和氢键,TYR-761残基可以与五元环形成π-π相互作用。AMGC模型在化合物5~8上的预测结果突出了相对应位置上原子的重要性。
作者额外收集了组蛋白去乙酰化酶(histone deacetyltransferases, HDACs)一系列有实验活性值的抑制剂小分子。在这些分子的抑制谱图预测中,AMGC取得了比之前的SOTA模型ETP更高的召回率。此外,在化合物CN88的预测中,AMGC针对9个组蛋白去乙酰化酶均做出了正确的预测半岛全站,在化合物CN143的预测中半岛全站,AMGC命中了8个组蛋白去乙酰化酶靶标中的6个。这说明AMGC有望被进一步地应用于高选择性的表观遗传药物开发工作。
访问手机版
微信公众号