1.文章简介
文章题目 | The biogenesis and emerging roles of circular RNAs |
中文题目 | 环形RNA的产生机制及潜在功能研究进展 |
期刊名 | NATURE REVIEWS MOLECULAR CELL BIOLOGY IF: 46.6 |
作者 | 陈玲玲(Chen Ling-Ling) |
发表时间 | 2016 |
作者单位 | 中国科学院上海生命科学研究院 |
相关产品 | CircRNA-seq |
2.前言
circRNA的种类繁多,其中一类通过pre-mRNA反向剪切(back-splicing)形成,早在上世纪80-90年代就已经被发现,被认为是剪切的副产物,无明确功能。随着测序技术和分析方法的极大改进,研究发现circRNA在细胞和组织中广泛表达。Pre-mRNA通过反向剪切在剪切位点间生成3ʹ,5ʹ-磷酸二酯键(Fig.1a),形成CircRNA,该过程通过剪体(spliceosome)完成,同时受到顺式和反式因子调控。目前,虽然对于circRNA功能认识仍然不够全面,但是越来越多的研究表明circRNA在基因表达调控方面扮演重要角色。基于此,作者分别从cirRNA广泛表达,cirRNA的产生机制,cirRNA的功能等3个方面介绍了circRNA研究进展,同时指出了各研究方向存在的问题及可继续开展的工作。
3.cirRNA广泛表达
polyA(-)、RNase R处理的建库方法,结合逐渐改进的circRNA分析流程,极大地促进了circRNA的发现及鉴定。多细胞动物(包括果蝇、线虫、小鼠、人类)、植物、细菌及真菌中均发现circRNA广泛表达,且circRNA类型呈现多样性。
早期研究认为,circRNA的表达量较低,被认为是线性剪切的副产物,无明确功能。然而,近几年研究表明,特定组织和特定细胞中少数基因的circRNA表达量明显高于线性mRNA,且circRNA的表达量具有明显的组织或细胞特异性,比如circRNA在脑组织中特异富集,在EMT过程中显著上调表达。另外,大量研究表明,circRNA和对应线性mRNA的表达量无明显相关关系。基于这些研究,作者总结:circRNA在特定组织和细胞中高表达,不能简单归为转录的副产物,而是具有重要功能。作者特别指出,已有研究表明,circRNA不一定比对应线性mRNA具有更明显的细胞特异性。因此,作者指出,不同细胞和组织中,circRNA与线性mRNA间的表达量关系需要进一步量化。此外,研究表明,CircRNA在细胞内较稳定,作者推测,不同细胞中,circRNA浓度及降解速率均可能存在差异。作者认为,有必要继续探索细胞内稳定的circRNA浓度是否能真实地反应circRNA生成和降解的动态平衡过程。
4.cirRNA的产生
circRNA来源于pre-mRNA,由RNA聚合酶II(RNA Pol II)转录而来,原则上,cirRNA生成,受到顺式调控原件和反式作用因子的调控。
4.1 circRNA的生成依赖于剪切体
circRNA生成过程中的反向剪切反应,需要经典剪切体复合物参与,特异识别外显子两侧的经典剪切位点。然而,circRNA的表达量通常明显低于对应线性RNA的表达量。据此推测,虽然细胞内的反向剪切机制仍不清楚,但是通过相同剪切位点,反向剪切的效率低于线性剪切效率。这种低效率可能是由于剪切体不能高效的结合在剪切位点,进而影响下游5ʹ供体位点和上游3ʹ受体位点的共价偶联反应(Fig. 1a)。
突变circRNA来源pre-mRNA不同位点的多腺苷酸信号,某些突变能减少circRNA的生成,而有的突变对circRNA生成无影响,表明circRNA的环化过程即可发生在转录后,也可能发生在转录时。果蝇头部,染色质关联RNA中检测到circRNA的存在,进一步证实circRNA可在转录时生成。由于染色质RNA中也能检测了成熟的3ʹpolyA,表明部分染色质RNA可能也经过转录后修饰,不完全是新生RNA。因此,circRNA的生成和mRNA转录过程间的关系需要进一步研究。通过对新生circRNA的研究,将进一步在基因组范围揭示circRNA生成动力学过程,同时解决该过程如何偶联其他mRNA的加工过程。
4.2 顺式元件促进circRNA的生成
通常,大部分circRNA包含有2或3个外显子,除了参与反向剪切的剪切位点,似乎不需要任何特异外显子序列。另外,通过可变剪切,不同的circRNA可能源于同一个基因,两个环化的外显子间,或保留内含子序列,或不含内含子序列(Fig. 1b)。但是,特别值得注意的是,反向剪切可能要求环化的外显子序列长度不能短于某个阈值。比如,对于高表达的circRNA,单外显子circRNA的外显子长度显著长于多外显子circRNA的平均外显子长度。
CircRNA的反向剪切过程,可能需要环化外显子两侧内含子中包含一些调控元件。研究表明,哺乳动物和线虫大部分circRNA及果蝇中一部分circRNA,由包含较长侧翼内含子的外显子环化形成,这些内含子通常分别拥有反向互补序列,可通过配对形成RNA双链,显著地增强了反向剪切过程(Fig. 1b)。RNA互补配对即可发生在重复元件间,也可发生在非重复互补序列间。虽然诸如30-40个核苷酸的短互补序列可促进circRNA生成,但是更长的互补序列具有更强的配对能力,可明显地增强circRNA生成。同时,同一侧翼内含子或不同侧翼内含子中的互补序列形成RNA双链时存在竞争,会对反向剪切效率产生影响(Fig. 1c),且同一内含子中RNA配对与剪切过程关联,不同侧翼内含子间RNA配对促进circRNA生成。此外,不同内含子中的反向或同向互补序列,理论上可能形成不同RNA配对序列,导致同一基因可形成不同circRNA,即可变环化过程(Fig. 1c)。
有趣的是,并不是所有环化外显子两侧均含有互补序列。例如,果蝇circRNA生成基因的侧翼外显子通常缺乏明显的配对序列,且水稻中只有少数环化外显子的侧翼内含子包含重复序列。在裂殖酵母Schizosaccharomyces pombe中,通过含有外显子的套索前体形成,来源于mrps16基因的某个环化外显子,不含互补配对序列。另外,当构建的表达载体时,插入侧翼内含子长度短至20个核苷酸且不包含任何反向重复序列,转入该载体的人类细胞中仍然可检测到标靶circRNA的表达。然而,未来需要进一步构建侧翼内含子包含任意顺式元件的表达载体,以探索顺式元件是否对circRNA形成具有真正的影响。研究表明,虽然顺式元件可能通过非此即彼的两种方式影响剪切:(1)侧翼内含子中短序列顺式元件可被RNA结合蛋白(RBP)识别,进而促进外显子环化;(2)已知作为经典剪切增强子或沉默子的剪切调控顺式元件可能也会影响反向剪切效率,但是剪切调控顺式元件与RBP共同参与调控线性剪切和反向剪切过程时的互作机制可能存在差异。
Figure 1 CircRNA的生成及调控
4.3 RNA结合蛋白调控circRNA的生成
如上所述,除了顺式元件,大量研究表明RBP也可参与调控circRNA的生成。有趣的是,在果蝇中,剪切因子Mbl(Muscleblind)可调控来源于同一pre-mRNA的circRNA生成过程,参与环化外显子的侧翼内含子中具有多个Mbl的结合位点,过表达Mbl蛋白或增加Mbl结合位点,均促进外显子环化,暗示Mbl可促进circRNA的生成(Fig. 1d)。QKI(quaking)也可能通过与pre-mRNA结合,显著的促进circRNA形成。在人类EMT过程中,QKI可上调多个circRNA的表达量,表明circRNA生成具有一定的细胞类型特异性,且在内含子中插入合成的QKI结合位点能有效的增强circRNA生成,这可能是由于QKI可形成二聚体,分别与两个侧翼内含子结合,从而使外显子能更好地环化,最终促使circRNA表达量上调(Fig. 1e)。
此外,ADAR1可抑制circRNA表达,该蛋白可将腺苷替换为硫苷,作用在环化外显子侧翼互补配对RNA双链上,进而影响RNA双链的互补与结合,减少反向剪切(Fig. 1f)。但是,目前研究表明ADAR1可能仅仅影响少数基因的circRNA生成,这可能与该蛋白也具有双链RNA结合功能相关,即可能通过其RBP功能参与调控circRNA的生成,独立于其碱基编辑活性。鉴于目前已知的成百上千RBPs,其他可能参与circRNA生成的RBP功能鉴定是未来重要的研究方向(one RBP, one paper!),也可研究多个RBPs如何共同影响circRNA生成。近期研究表明,在果蝇中,Laccase 2 基因的反向剪切受到内含子重复序列及多个RBPs联合调控。总之,细胞中circRNA生成的调控机制远比目前已知的复杂。
5.cirRNA的功能
circRNA广泛地低表达暗示其为真核生物转录时可耐受的副产物,且目前为止,大部分已知的circRNA似乎没有明显功能。但是,近年研究揭示了一些circRNA的重要生理功能,比如在脑组织广泛表达的circRNA,某些circRNA可在在多方面调控基因表达。
5.1 circRNA通过吸附miRNA调控基因表达(miRNA海绵)
大多数已知的circRNA主要存在于细胞质中。虽然插入核糖体进入位点的circRNA能完成翻译,但是没有证据显示内源circRNA可与核糖体互作,进行翻译。事实上,circRNA可成为RNA干涉的靶标分子,表明一些结构更稳定的circRNA可能与mRNA竞争结合miRNA,进而调控基因表达。关于circRNA分子海绵模型,目前研究的最清楚的是来源于CDR1基因的ciRS‑7,该circRNA能吸附miR-7(Fig.2a)。ciRS‑7特异地在人和小鼠的脑组织中大量表达,含有超过60个保守miR-7靶标位点,每个细胞中所有ciRS‑7能结合多达20,000个miR-7分子,进而强烈地影响miR-7与靶标mRNA的结合。降低ciRS‑7的表达,会引起含有miR-7结合位点的mRNA表达减少,进一步表明ciRS‑7与mRNA竞争结合miR-7。另外,人类和斑马鱼中ciRS‑7具有类似功能,暗示其功能具有保守性。然而,哺乳动物中,除了ciRS‑7,只有少数几个circRNA具有miRNA海绵功能,包括circSRY及几个来源于锌指蛋白基因的circRNA,这些circRNA均含有一定数量的miRNA结合位点。虽然circRNA中的miRNA结合位点不一定均与分子海绵功能相关,但是大部分人类和小鼠circRNA只是含有很少miRNA结合位点,暗示大多数circRNA的功能可能并不是miRNA海绵。
与哺乳动物circRNA相比,果蝇circRNA含有超过1000个高度保守的miRNA匹配位点,但是目前不清楚这些circRNA是否具有miRNA海绵作用。值得注意的是,最近miRNA功能定量研究表明,改变miRNA丰度似乎对基因表达无显著影响。
5.2 circRNA通过参与转录调控基因表达
虽然大多数circRNA均定位于细胞质,但是人类细胞中含有内含子的circRNA更倾向可能被限制在细胞核内。实际上,目前并不清楚circRNA的核输出或核保留过程。由于许多内含子保留的线性RNA主要定位于细胞核内,据此推测内含子保留的circRNA可能通过相似方式定位于核内。
ciRNAs是细胞内另外一种核定位circRNAs,只包含内含子,来源于套索结构内含子。为了避免被剪切,ciRNAs形成依赖于一类共有序列,该序列在5ʹ剪切位点附件含有7nt的富含GU的基序,而在分支位点含有11nt的富C基序(Fig. 2b),通过2ʹ,5ʹ-磷酸二酯键连接,并缺乏从内含子3ʹ端向分支点延伸的线性序列。人类细胞及西方爪蟾Xenopus tropicalis的卵母细胞中,均检测到了大量ciRNAs。人类细胞中,ciRNAs会在细胞核中大量累积,进而顺式调控基因转录,一些高表达ciRNAs,比如ci‑ankrd52及ci‑sirt7,直接定向于Pol II复合体并与其互作,清除这些ciRNAs会降低对应的ANKRD52及SIRT7基因的转录水平,表明ciRNAs可促进其母基因的Pol II转录,尽管相关机制仍然不清楚。
另外,内含子与外显子共同环化形成的核内circRNA,即EIciRNAs,也可与Pol II互作。敲低EIciEIF3J及EIciPAIP2等EIciRNAs,可显著降低其母基因的转录。通常,EIciRNAs与U1 snRNP结合,然后结合到编码基因的启动子,EIciEIF3J及EIciPAIP2的内含子中均含有U1 snRNP结合位点,而改变EIciRNAs的RNA-RNA互补序列,可降低EIciRNA与Pol II结合,也可降低EIciRNA-U1 snRNP复合体与对应编码基因EIF3J及PAIP2启动子结合能力,进而减少了基因转录(Fig. 2c)。
综上所述,虽然研究表明一些核定位的circRNA具有转录调控功能,但是相关作用机制仍然不清楚。另外,circRNA是否存在一些反式调控基因转录位点,需要进一步研究。实际上,ciRNA也可定位于细胞核外,这些circRNA是否具有其他功能,值得进一步研究,比如:作为RBPs诱饵。研究表明,大多数肌萎缩侧索硬化症(ALS)患者的退行性神经元细胞中,DNA结合蛋白TDP43会大量累积,而RNA套索脱支酶DBR1功能缺失时,内含子circRNA累积,会与TDP43在细胞质中结合,抑制其进入细胞核内与DNA结合,进而抑制其对神经细胞的影响。
5.3 circRNA通过参与剪切调控基因表达
circRNA通常来源于蛋白编码基因位于基因中央区域的外显子。因此,circRNA的生成可能会影响pre-mRNA的可变剪切,进而改变基因表达。虽然反向剪切通常比线性剪切更难发生,但是circRNA生成与pre-mRNA剪切竞争相同的3ʹ和5ʹ剪切位点,导致那些含有环化外显子的线性mRNA表达水平更低。(Fig. 2d)。原则上,某个外显子参与环化的数量越多,成熟mRNA中该外显子的数量越少。
外显子跳跃是人类细胞pre-mRNA加工过程中最普遍发生的可变剪切事件,理论上,circRNA的形成应该和线性mRNA外显子跳跃成正相关关系(Fig. 2d),这种相关关系已经通过circRNA表达载体实验及相关RNA-seq数据证实。然而,并不是所有跳跃外显子均能形成circRNA,暗示还有其他调控因子影响外显子跳跃后的外显子环化过程。
6.视点
该部分作者总结circRNA产生及功能研究中存在的问题及未来研究方向。circRNA生成方面包括:剪切体参与circRNA生成的精确机制;顺式和反式因子如何调控circRNA生成;cirRNA差异表达与疾病发生等生理过程关系;circRNA的核输出机制;circRNA的降解机制。circRNA功能方面包括:cirRNA的表达和功能保守性需要进一步研究;cirRNA调控基因表达的机制,目前认识仍然有限;circRNA未知的生理功能及作为潜在的疾病检测靶标。作者认为:深入研究circRNA生成是明确circRNA功能的关键;明确circRNA和线性RNA共表达,必须改进circRNA的检测方法,避免影响母基因的表达;circRNA的广泛表达及其潜在功能,大大增加了真核生物转录组多样性和复杂性。
参考文献
Chen, L.-L. (2016). The biogenesis and emerging roles of circular RNAs. Nature Reviews Molecular Cell Biology, 17, 205.