科研工作
英雄联盟比赛押注a:陈语谦教授指导我院学生提出基于注意力特征聚合器和知识蒸馏预测药物活性
近日,我院本科生袁伟宁、博士生陈观兴在国际杂志Briefings in Bioinformatics(期刊影响因子为13.994)在线发表了题为“FusionDTA: attention-based feature polymerizer and knowledge distillation for drug-target binding affinity prediction”的论文。该论文提出了一个新的DTA预测框架FusionDTA,使用一种利用注意力权重来聚合全局信息的多头线性注意力机制,从而解决了现有的特征聚合方法难以有效聚合大型特征编码器输出向量的问题。
图1 FusionDTA的整体架构
图2 FusionDTA教师和学生模型的训练阶段
FusionDTA在评价指标上优于现有模型。当预测数据与训练数据不属于同一数据集时,被证明比现有模型更有效。同时,知识蒸馏被证明有助于FusionDTA的性能提升,可以在损失极小预测精度的前提下减少模型50%的可训练参数量。
图3 FusionDTA与基准模型的性能对比
此外,FusionDTA为理解分子相互作用的本质和捕获蛋白质和分子的结合袋提供了生物学见解。在基于结构的药物设计中,DTI的可视化可以有效地帮助预测蛋白质的结合区域。FusionDTA获得的注意力权重可以用来分析药物小分子与靶蛋白相互作用的具体位置或基团,其中注意力机制用于计算出蛋白质序列与药物相互作用的一些关键区域。
图4FusionDTA注意力权重可视化模型的实例
上述研究得到了国家自然科学基金面上项目(No.62176272)等项目的支持,袁伟宁、博士生陈观兴为论文共同第一作者,陈语谦教授为论文通讯作者。
陈语谦教授长期致力于人工智能交叉领域研究,入选了2022年“全球顶尖前10万科学家”榜单和“爱思唯尔2021中国高被引学者”榜单。2020年指导本科生以作品《基于机器学习的药物筛选系统——以筛选新冠药物为例》在第二届全国大学生智能技术应用大赛中荣获一等奖。
论文链接:https://academic.oup.com/bib/article/23/1/bbab506/6470967.