方法描述:一个基因表达水平的直接体现是其转录本的丰度,转录本丰度程度越高,则基因表达水平越高。在RNA-seq分析中,我们通过定位到基因组区域或基因外显子区的测序序列(reads)的计数来估计基因的表达水平。Reads计数除了与基因的真实表达水平成正比外,还与基因的长度、测序深度成正相关。为了使不同基因、不同实验间估计的基因表达水平具有可比性,引入了RPKM的概念,RPKM(reads per kilobase per millionmapped reads)是每百万reads中来自某一基因每千碱基长度的reads数目。RPKM同时考虑了测序深度和基因长度对reads计数的影响,是目前最为常用的基因表达水平估算方法。通过对mRNA长度和测序深度进行均一化(RPKM),使不同测序样本之间的表达丰度具有可比性,消除了因mRNA长度和不同样本之间测序丰度差异带来的偏差。计算公式:
据今年三月的Nature杂志报道,洛克菲勒大学的Sohail F. Tavazoie团队发现m6A(N6-methyladenosine)是促进microRNA生成的关键性转录后修饰。初级microRNA(pri-miRNA)需要经过一系列的加工才能形成成熟的miRNA,这其中的第一步是由DGCR8识别pri-miRNA茎环结构,再招募DROSHA切割双链RNA,生成前体miRNA(pre-miRNA)。在此之前,DGCR8如何在众多转录本二级结构中识别并结合pri-miRNA的结构并不清楚。
1. Cahová H, Winz M L, Höfer K, et al. NAD captureSeq indicates NAD as a bacterial cap for a subset of regulatory RNAs.`{`J`}`. Nature, 2015, 519(7543).
3.Klöcker, N., Weissenboeck, F.P., van Dülmen, M. et al. Photocaged 5′ cap analogues for optical control of mRNA translation in cells. Nat. Chem. 14, 905–913 (2022).