很多课题做到RNA-seq这一步时,都会得到一份“看起来很丰富”的结果,有差异基因了,有通路富集了,也能讲某个信号通路被激活或抑制了。但在真正写文章、做答辩、和老师讨论时,大家往往又会遇到同一个问题,RNA-seq可以说明了变了什么,但还没有真正回答为什么会变。这也是很多课题推进到后期最容易卡住的地方。因为表达变化本身,更接近结果层面的证据,但是机制文章通常还需要继续往上游追,找到调控来源,进而补上直接证据。所以RNA-seq做完之后,下一步到底该怎么接,才能把机制讲完整?
一、RNA-seq更像是机制研究的起点,而不是终点
RNA-seq可以帮助我们发现线索、筛选候选、建立研究方向:
哪些基因发生了上调或下调
哪些通路被显著影响
哪些生物学过程值得继续追踪
哪些候选分子可能与表型相关
但RNA-seq不能单独证明下面这些问题:
是哪个转录因子在调控这些基因?
这个蛋白是否真的结合到了目标基因的启动子或增强子区域?
这个基因变化背后,是染色质开放性改变、组蛋白修饰变化,还是DNA甲基化变化?
变化发生在转录水平,还是RNA加工、稳定性、修饰等转录后层面?
二、想把机制讲完整,关键是把差异表达往上游补
一个相对完整的机制链条,需要从处理因素/表型变化及RNA-seq发现差异基因继续推进到上游调控事件。主要取决于课题到底在问哪一类机制问题。
01 如果怀疑是转录因子调控(最常见)
比如RNA-seq发现某个基因明显上调,进一步分析后怀疑是某个转录因子在驱动它的表达。这时候单靠RNA-seq只能说明表达相关,不能说明直接结合。可以先结合文献、motif预测、公共数据库等等初步筛选潜在调控因子,再判断目标基因启动子/增强子区域是否存在候选结合位点,然后用ChIP-qPCR做定点验证(可以回答这个蛋白是否真的结合了这个基因;它结合的是哪一段调控区;这种结合在处理组和对照组之间有没有变化等等问题),如果希望从全基因组层面系统看结合谱可以进一步做ChIP-seq或CUT&Tag。
02 如果怀疑是染色质状态改变或组蛋白修饰变化
有些课题里RNA-seq提示了大量基因表达变化,但并没有特别明确的单一上游因子。这时候真正发生变化的,可能不是某一个转录因子,而是更上层的染色质可及性或表观修饰状态。比如说某些基因被整体激活,可能与启动子或增强子区域开放有关;某些抑制性基因被沉默,可能与组蛋白修饰变化有关;同样的刺激条件下,不同细胞状态响应差异明显,背后可能就是染色质状态不同等等。这种情况下,更适合考虑的下一步可以做ATAC-seq来看染色质开放性是否改变(可以回答为什么这些基因会被同时激活或沉默;表达变化背后是否有染色质层面的重塑;某条通路被打开是否是因为调控区更开放了等等问题),或者做ChIP-seq / CUT&Tag看关键组蛋白修饰是否发生变化。
表 ChIP-seq / CUT&Tag常见组蛋白修饰。
表 常见组蛋白修饰含义。
表 常见组蛋白修饰推荐组合。
03如果怀疑DNA甲基化或其他表观修饰在起作用
有些研究对象里,表达变化并不只是短期转录响应,更像一种相对稳定的表达重编程。尤其是在发育、分化、肿瘤、应激记忆等场景中,DNA甲基化往往是很值得研究的一层。这时候更适合用WGBS / EM-seq / 靶向甲基化检测等DNA甲基化相关技术,如果表达数据和甲基化数据能够对上时,文章的机制解释会更扎实。
图 DNA甲基化相关常用技术。
04 如果怀疑问题发生在转录后调控
还有一类情况也很常见就是RNA-seq的结果和预期并不完全一致,或者发现某些关键基因变化并不能很好地用经典转录调控来解释。这时候可以考虑问题可能不在DNA到RNA的转录启动这一层,而是在RNA后续命运上,比如说RNA结合蛋白调控/剪接改变/RNA 稳定性改变/RNA 修饰变化(如 m6A)等等。对于这类研究路径,可以考虑RIP-seq / RIP-qPCR/eCLIP / LACE-seq等RNA-蛋白互作技术以及m6A MeRIP-seq等RNA修饰检测。
三、常见思路
很多课题后面越做越乱,问题不在于技术不够多,而在于没有先想清楚下一步到底最需要补哪一段证据?不是所有项目都需要把ATAC-seq、ChIP-seq、甲基化、RNA 修饰全部做一遍。一般常见思路有:
如果你的课题已经做了RNA-seq,但还不确定下一步该接ChIP-qPCR、ChIP-seq、CUT&Tag、ATAC-seq,还是其他表观组学/转录后调控技术,欢迎进一步交流研究思路。