news 2026/6/10 13:10:14

BioPathNet:基于路径嵌入的医学生物知识图谱链接预测框架

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
BioPathNet:基于路径嵌入的医学生物知识图谱链接预测框架

在医学生物知识图谱(KG)中,生物实体(基因、蛋白质、疾病、药物)以节点表示,其相互关系(相互作用、关联、调控)以边表示。尽管高通量实验不断产生数据,但图谱中的许多关系仍未发现。链接预测(LP)方法通过分析网络拓扑来推断缺失或潜在关联,因此至关重要。

本文介绍了BioPathNet,这是一种基于神经贝尔曼-福特网络(NBFNet)构建的消息传递神经网络框架,旨在利用路径表示学习的力量,在医学生物知识图谱上进行链接预测。与NBFNet相比,BioPathNet引入了多项改进,包括使用背景调控图谱(BRG)来增强消息传递,以及采用节点类型感知(NTA)负采样策略,以提高学习精度并处理图的异质性。这些设计选择对于提升特定任务的性能至关重要。

我们在不同规模、稀疏度和质量的多样化医学生物知识图谱上评估了BioPathNet的链接预测任务,包括:使用来自Pathway Commons的KEGG通路进行基因功能分配、使用PrimeKG进行零样本疾病-药物适应症预测、使用SynLethDB进行合成致死基因对预测,以及使用LncTarD 2.0推断长链非编码RNA与靶基因之间的调控关系。我们的结果表明,BioPathNet在医学生物链接预测方面具有通用性,其性能始终优于随机预测,其成功程度因任务而异。消融研究进一步强调了关键设计选择的优势,例如NTA负采样和使用BRG进行消息传递。

与通用基线相比,BioPathNet不仅超越了一跳知识图谱嵌入方法(如TransE、DistMult和RotatE),而且在所有任务中始终优于更具表达力的节点嵌入模型(如R-GCN、RAGAT和HGT),MRR性能提升范围从基因功能预测的2%到药物重定位的87%。这突显了路径表示学习相对于那些分别计算节点和关系嵌入的方法的优势和表达能力,即使后者在表示中包含了图异质性。然而,BioPathNet中路径表示学习的卓越准确性和性能是以更高的计算训练时间和资源需求为代价的。

与四个不同链接预测任务的特定任务基线相比,BioPathNet在所有五个零样本疾病子集(肾上腺、贫血、心血管、细胞增殖和心理健康)的药物重定位特定基线上均优于DREAMwalk和最先进的TxGNN,AUPRC平均分别提高了60.8%和23.2%。此外,BioPathNet实现了更高的Recall@k值,在top预测中更好地优先考虑了已知治疗方法。具体来说,在k=20时,BioPathNet恢复了61.9%的已知治疗方法,而TxGNN为53.9%。这在生物学中尤其有价值,因为BioPathNet增强的优先级排序减少了在假设生成或实验验证过程中需要验证生物合理性的预测数量。

与节点嵌入方法相比,基于路径嵌入的方法(如BioPathNet)通过多跳关系增强了表示,并通过追踪和可视化路径以及有影响的节点提供了更好的可解释性,这有助于验证预测和生成假设。结合BRG进一步提高了路径的表达能力和可解释性,揭示了关键路径并验证了预测,例如在阿尔茨海默病案例中。

我们证明了BioPathNet在处理各种知识图谱的不同问题以及在合成致死性(包括归纳设置)方面的通用性。然而,推断lncRNA-靶标调控关系对所有方法(包括BioPathNet)来说都是最困难的任务,这可能源于训练数据和BRG的质量和不确定性。

BioPathNet的局限性包括训练数据中潜在的偏差。未来的改进可能涉及排除在主要关系(如适应症)上的消息传递,并优先考虑分子相互作用,以阐明对阿尔茨海默病等了解较少的疾病的潜在机制。最后,BioPathNet为每个任务使用不同的BRG,这可能会根据所选的BRG引入偏差。

总之,BioPathNet是一种用于生物知识图谱链接预测的路径嵌入方法,在基因功能预测、药物适应症、合成致死性和mRNA-lncRNA相互作用等任务中实现了最先进的性能。其可解释性框架突出了关键的预测路径,提高了生物合理性并有助于偏差检测。未来的方向包括改进和去噪医学生物知识图谱,利用条件特定知识以及整合节点特征。最终,BioPathNet可以作为医学生物知识图谱中预测模型的基础,加速整个生物学和医学领域的假设生成。FINISHED
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/10 12:32:22

开题报告 springboot和vue小区物业管理系统 文献综述

目录 开题报告文献综述:SpringBoot与Vue的小区物业管理系统技术背景与现状相关研究与应用案例技术难点与创新方向 项目技术支持可定制开发之功能亮点源码获取详细视频演示 :文章底部获取博主联系方式!同行可合作 开题报告文献综述&#xff1a…

作者头像 李华
网站建设 2026/6/9 16:13:50

2007-2024年上市公司高管绿色认知数据

数据简介 高管绿色认知是指企业高层管理人员对环境保护和可持续发展的认识和行动。本数据借鉴李亚兵等(2022)针对高管环保认知的衡量手段,运用文本分析法对上市公司年报展开剖析。从绿色竞争优势意识、企业社会责任意识、外部环境压力认知这…

作者头像 李华
网站建设 2026/6/10 12:39:25

OFTP2系列之三:Odette 标准核心业务流程与报文交互

Odette标准定义了一套完整的业务流程与报文交互体系,核心围绕整车厂(OEM)与零部件供应商的协作闭环,覆盖采购计划→生产发货→物流执行→财务结算四大核心环节,核心报文通过OFTP2.0协议传输,确保数据安全与…

作者头像 李华
网站建设 2026/5/23 6:33:41

深度测评9个降AI率工具 千笔·降AIGC助手助你轻松降AIGC

AI降重工具:让论文更自然,让学术更安心 在当前高校论文审核日益严格的背景下,越来越多的本科生开始关注“**论文降AIGC率、去AI痕迹、降低查重率**”这一问题。随着AI写作工具的普及,许多学生在使用AI辅助写作后,发现…

作者头像 李华
网站建设 2026/6/10 0:18:18

OOP与AOP的区别及应用场景解析

面向对象编程(OOP)和面向切面编程(AOP)是软件开发中两种重要的编程范式。OOP通过封装、继承和多态来组织代码,而AOP则专注于横切关注点的模块化处理。理解两者的关系和适用场景,能帮助开发者设计出更清晰、…

作者头像 李华