摘要
虚拟细胞是细胞的世界模型,是可跨模态、跨尺度预测、模拟与调控细胞过程的计算系统。实现该目标的核心路径之一,是建模遗传与化学扰动引发的转录响应,这一能力对疾病研究和药物研发至关重要。现有方法高度依赖专家干预,需历经数月的手动模型设计、训练与调试迭代。本文提出融合AI编码智能体与多模态生物基础模型的自主AI系统VCHarness,可自动化构建扰动-响应模型。该系统以极低人工干预,在庞大的架构与训练流水线空间中自主探索,迭代生成、评估并优化候选模型。在多项扰动-响应基准测试中,VCHarness挖掘的架构性能超越专家设计方案,且将开发周期从数月压缩至数天。该系统还揭示了与性能提升相关的非直观架构模式,证明自动化搜索可突破传统设计思路。研究结果预示,虚拟细胞世界模型组件的构建将从人工工程化转向自主系统驱动,为细胞系统的规模化数据驱动探索提供支撑。
xingyi.cheng@genbio.ai
le.song@genbio.ai
eric.xing@genbio.ai
#虚拟细胞 #人工智能 #扰动响应模型 #AI编码智能体 #生物基础模型 #蒙特卡洛树搜索
系统概述
系统核心架构与闭环工作流
图1VCHarness系统总览
a,系统整合AIDO系列生物基础模型、编码智能体、约100项虚拟细胞模型开发插件化技能,以及基于蒙特卡洛树搜索(MCTS)的节点选择策略;该分布式系统可并行训练多个模型,同时统筹各工作节点的整体搜索流程。
b,K562细胞差异基因表达预测任务的代表性MCTS搜索树;节点颜色代表验证集F1分数,高亮轨迹为程序空间中逐步迭代至高性能区域的优化路径;下方面板汇总最优配置(验证集 F1=0.513),包括所用基础模型、融合策略、预测头与优化设置。
c,K562搜索任务中,单个MCTS节点各阶段的平均耗时;模型执行与训练占主导,评估、反馈与树更新的开销相对极低。
d,K562搜索任务中,单个MCTS节点各阶段的平均成本(美元);执行训练(H100)按GPU小时定价估算,其余阶段参照Claude Sonnet 4.6定价;成本主要分配于程序生成、调试与执行训练,评估环节占比较小。
实验结果
跨数据集性能一致性提升
图2不同CRISPR扰动场景下VCHarness的性能与搜索动态
a,在4种细胞系(HepG2、K562、Jurkat、hTERT-RPE1)的差异基因表达(DEG)分类任务中,VCHarness(蓝色)性能超越按输入模态或知识来源分组的人工设计模型;虚线为平均性能;基线模型来自foundation-models-perturbation仓库;跨细胞系的稳定性能提升证明自主搜索闭环在不同细胞系间的可迁移性;纵轴为测试集宏平均F1分数。
https://github.com/genbio-ai/foundation-models-perturbation/tree/main/results/ scores
b,蒙特卡洛树搜索(MCTS)过程中的最优性能轨迹;灰色点为已评估的候选模型,蓝色线为实时最优性能;初期快速提升、后期逐步优化的趋势,体现了搜索资源的高效分配;横轴为按评估时间排序的候选模型,纵轴为验证集宏平均F1分数。
自主发现新颖非直观模型架构
图3 VCHarness通过搜索发现非直观架构模式
a,hTERT-RPE1细胞DEG分类任务的MCTS可视化;节点颜色编码验证集宏平均F1分数,高亮轨迹展示搜索逐步聚焦于程序空间高性能区域的过程。
b,成功分支上的代表性局部修改;这些排序后的优化操作表明,性能提升源于架构与优化策略的序列式调整,而非单次跳跃式改进。
c,a中标记为⑨的节点所对应的模型架构;该模型融合图结构、选择性微调与扰动条件化计算,体现VCHarness生成的可执行程序区别于简单的单模态隔离基线。
d,已评估节点的验证集与测试集分数相关性;近线性一致性证明基于验证集的选择可可靠泛化至独立测试集。
e,所有搜索架构的基序频率分析;按高频设计选择对发现的模型分组,凸显与更强性能反复关联的神经网络架构基序。
跨细胞系架构发现
图4 HepG2细胞的架构发现
a,HepG2细胞核心数据集任务的MCTS可视化。
b,成功分支上的排序式局部修改,展示搜索如何通过序列式编辑提升性能。
c,从高亮分支中得到的最优发现模型架构。
d,已评估节点的验证集与测试集分数相关性,验证集性能可作为实用搜索目标。
e,所有搜索架构的基序分析,汇总在更优HepG2模型中高频出现的神经网络架构选择;该任务中最优方案反复青睐以图扰动结构为核心、融合额外预训练表达特征的多模态架构。
图5 Jurkat细胞的架构发现
a,Jurkat细胞核心数据集任务的MCTS可视化。
b,成功分支上的排序式局部修改。
c,最优发现的Jurkat模型架构。
d,已评估节点的验证集与测试集分数相关性。
e,所有搜索架构的基序分析,凸显与更优Jurkat性能反复关联的神经网络架构基序;相较于HepG2,Jurkat的高性能节点更常采用紧凑架构、显式扰动建模与轻量化融合策略。
图6 K562细胞的架构发现
a,K562细胞核心数据集任务的MCTS可视化。
b,成功分支上的排序式局部修改。
c,最优发现的K562模型架构。
d,已评估节点的验证集与测试集分数相关性。
e,所有搜索架构的基序分析,汇总与K562性能提升反复关联的架构模式;K562的成功节点反复将强细胞级骨干网络与图扰动模块、门控融合结合,体现预训练细胞表征与显式网络先验间的稳定协同。
迁移至MPRA表达预测任务
图7 MPRA-K562细胞架构与搜索总结
a,MPRA-K562微调任务的MCTS搜索树(37个节点,2个初始种子);节点颜色编码验证集皮尔逊相关系数(0.694-0.876);种子1:AlphaGenome预训练编码器;种子2:从0构建的卷积神经网络。
b,最优节点(节点1-3-3-1,验证集r=0.876)的架构:采用扁平化拼接的AlphaGenome卷积编码器与双层MLP头,2阶段训练(先冻结编码器训练头,再全微调)。
c,最优优化路径;每行代表最优分支上按验证集分数选择的1次MCTS迭代。
d,最优节点的训练曲线(按验证集分数选择);上图为第1阶段(仅训练头)与第2阶段(编码器全微调)的验证集皮尔逊r;下图为训练损失。
e,搜索树所有节点的验证集与测试集皮尔逊r;2者皮尔逊相关系数为0.999。
f,所有节点的特征分析;双轴柱状图展示各分类(预训练模型、微调策略、头类型、学习率调度器)的节点数(蓝色)与平均测试集皮尔逊r±标准差(绿色)。
图8 MPRA-HepG2细胞架构与搜索总结
a,MPRA-HepG2微调任务的MCTS搜索树(55个节点,2个初始种子);节点颜色编码验证集皮尔逊相关系数(-0.028-0.888);种子1:AlphaGenome预训练编码器;种子2:从0构建的卷积神经网络。
b,最优节点(节点1-3-2,验证集r=0.888)的架构。
c,最优优化路径,按验证集分数选择。
d,最优节点的训练曲线(按验证集分数选择)。
e,搜索树所有节点的验证集与测试集皮尔逊r;2者皮尔逊相关系数为0.9998。
f,所有节点的特征分析;双轴柱状图展示节点数与平均测试集皮尔逊r±标准差。
图9 MPRA-WTC11细胞架构与搜索总结
a,MPRA-WTC11微调任务的MCTS搜索树(125个节点,2个初始种子);节点颜色编码验证集皮尔逊相关系数(0.071-0.849)。
b,最优节点(节点1-3-2-1-2,验证集r=0.849)的架构。
c,最优优化路径,按验证集分数选择。
d,最优节点的训练曲线(按验证集分数选择)。
e,搜索树所有节点的验证集与测试集皮尔逊r;2者皮尔逊相关系数为0.975。
f,所有节点的特征分析;双轴柱状图展示节点数与平均测试集皮尔逊r±标准差。
详细总结
思维导图
跨细胞系性能领先
参考
Harnessing AI to Build Virtual Cells
doi: https://doi.org/10.64898/2026.04.11.717183
260414VCHarness.pdf
注:AI辅助创作,如有错误欢迎指出。内容仅供参考,不构成任何建议。