RIP-seq技术介绍

RIP技术(RNA Binding Protein Immunoprecipitation,RNA结合蛋白免疫沉淀),是研究细胞内RNA与蛋白结合情况的技术,是了解转录后调控网络动态过程的有力工 具,能获得RBP的调控靶点,同时也能帮助发现miRNA的调节靶点。RIP技术运用针对目标蛋白的抗体把相应的RNA-蛋白复合物沉淀下来,然后经过分离纯化就可以对结合在复合物上的RNA进行分析。RIP是染色质免疫沉淀ChIP技术的类似应用,但由于研究对象是RNA-蛋白复合物而不是DNA-蛋白复合物,RIP实验的优化条件与ChIP实验不太相同(如复合物不需要固定,RIP反应体系中的试剂和抗体绝对不能含有RNA酶,抗体需经RIP实验验证等)。RNA免疫共沉淀测序(RIP-seq),将RIP与新一代测序技术结合起来,在基因组范围内发现与蛋白或蛋白复合物相结合的RNA。

产品优势

RIP-seq研究的是自然状态下最原始的RBP和RNA的互作状态,捕获到的RNA未经酶切片段化,获得的RNA片段较长,也无需RBP切胶纯化步骤,操作流程简单,成功率高,但是不能得到RBP直接结合的RNA位点。
我司也自主研发了iRIP-seq(improved RIP-seq)技术,其整合了RIP-seq操作的简洁性和CLIP-seq识别RNA结合位点的优势,可以高效探测RBP直接和间接 的RNA 结合位点。在该项技术中,我们取消了凝胶纯化和 RNP 标记步骤,并保留了 CLIP操作的其他步骤,改进了文库构建的方法。

实验原理

·用抗体或表位标记物捕获细胞核内或细胞质中内源性的RNA结合蛋白。
·防止非特异性的RNA的结合。
·免疫沉淀把RNA结合蛋白及其结合的RNA一起分离出来。
·结合的RNA序列通过microarray(RIP-Chip),定量RT-PCR或高通量测序(RIP-Seq)方法来鉴定。

iRIP-seq实验操作流程

案例解析

案例1

FOXN3是一种转录抑制因子,SIN3A是ER+细胞(雌激素受体阳性细胞)中的一种抑制因子复合物,本文作者通过研究FOXN3的病理学功能机制,发现FOXN3这种转录因子与SIN3A会发生蛋白质之间的互相作用,并且这种互作需要由乳腺癌细胞中的雌激素诱导产生的NEAT1(一种Long noncoding RNAs)的参与。为了研究介导FOXN3和SIN3A复合体互相作用的RNA,使用了iRIP-seq技术(生命之美自主开发的技术,基于RIP-seq的改进版)最终通过两种数据分析方法(Piranha和CIMS)筛选出两种lncRNA,NEAT1和MALAT1(图2A和2B),然后再通过对NEAT1和MALAT1敲除和过表达后进行CoIP检测的方法确定了NEAT1是FOXN3和SIN3A互作所必需的(图2C)。在小鼠体内实验证实FOXN3-NEAT1-SIN3A复合物促进癌细胞肺转移(图2D)。

FOXN3结合RNA的RIP-seq数据分析结果展示

 FOXN3结合RNA的RIP-seq数据分析结果展示,及实验验证结果展示

案例解析

案例2

采用miR-31基因敲除(31-KO)和C57BL/6J野生型小鼠构建对乙酰氨基酚(APAP)诱导的DILI模型。采用小鼠原代肝细胞和小鼠肝细胞系 (AML-12)进行体外实验。通过Ago 2相关RNA免疫沉淀结合高通量测序来识别miR-31的特异性靶点。
RNA免疫沉淀结合高通量测序的生物信息学分析发现,JNK信号上游分子细胞分裂周期蛋白42 (Cdc42)是miR-31的特异性靶点,可形成miR-31/Cdc42/磷酸化混合谱系激酶3 (p-MLK3)负反馈环,限制JNK过度活化。

 通过Ago2 RIP-seq获取miR-31的靶标mRNA。

(A)Ago2 RIP-seq流程图。(B)miR-31靶标筛选策略。(C)RIP-seq中Ago2结合Cdc42的peak峰图。(D)APAP诱导DILI模型小鼠中,miR-31敲除后促进Cdc42的表达。(E)APAP诱导DILI细胞模型中,miR-31敲除后促进Cdc42的表达。(F)APAP诱导DILI模型小鼠中,JNK上游信号通路中p-MLK3和p-MLK4表达上调。(G)APAP诱导DILI细胞模型中,转染miR-31的inhibitor后,p-JNK以及JNK上游信号通路中p-MLK3和p-MLK4表达上调。(H)双荧光素酶报告基因实验验证miR-31与Cdc42靶向关系。(I)APAP诱导DILI细胞模型中,敲低Cdc42后p-JNK表达下调。(J)将I中细胞进行流式检测细胞坏死情况。

miR-31通过下调Cdc42抑制APAP诱导DILI肝细胞ROS/JNK/线粒体的过度激活的分子调控机制模型图。

一、iRIP-seq数据分析方案流程

二、iRIP-seq数据质量分析

Clean reads碱基质量分析

方法描述:碱基质量值是衡量测序质量的重要指标,碱基质量(Q)与测序错误率(P)密切相关,受测序仪状态,测序试剂质量,样本特性等的影响。质量值计算公式如下:

结果展示

GC含量分析

方法描述:对测序reads中四种碱基的分布比例进行评估,检查是否存在AT、CG分离现象,理论上A与T、C与G的含量在整个测序反应中分别相同,且维持 在稳定水平。

有效长度统计

方法描述:去掉index序列、建库平衡用随机碱基及截取掉后面低质量的碱基后,我们用获得的clean reads进行有效长度分析。

cDNA库的代表性分析

方法描述:如果PCR扩增过度,文库中会含有大量序列完全相同的reads。为了保证文库更好代表原始DNA的丰度,本公司在建库中对PCR扩增循环有严格控制。

PCR duplication level计算方法为:从测序数据中随机挑选20万reads作为Total Reads,按照如下公式进行计算:

PCR duplication level=Duplication reads/ Total reads

三、iRIP-seq结果展示

全基因组定位分析

Reads比对到参考基因组结果

方法描述:在这部分分析中,我们将有效测序数据(clean reads)比对到参考基因组上。

Reads在基因组不同区域的分布情况

方法描述:将clean reads比对到参考基因组上,统计各个区域的分布情况,统计结果如下:

基因组的覆盖度和特征分析

方法描述:CLIP-seq reads随转录单元长度的覆盖强度分析,以距转录起始位点和转录终止位点为标准,把cDNA平均分成100份,每一份称为一个bin,求落在每个bin中的reads平均数之和,从而得到每个bin上整体的reads覆盖度。

方法描述:把基因平均分成100份,每一份称为一个bin,求落在每个bin中的reads平均数之和,从而得到每个bin上整体的reads覆盖度。

方法描述:CLIP-seq reads随转录单元长度的覆盖强度分析,将基因的5’UTR, CDS, 3’UTR各平均分成100份,每一份称为一个bin,求落在每个bin中的reads 平均数之和,从而得到每个bin上整体的reads覆盖度。

reads在转录起始位点,转录终止位点,起始密码子和终止密码子附近的分布

方法描述:分别以转录起始位点/转录终止位点,翻译起始密码子/终止密码子为原点,统计其上下游1kb范围内reads的分布情况。

样本相关性分析

方法描述:统计落在每个gene上的reads数目,计算每个gene的RPKM值,然后通过比较同一个gene在两个样本中的RPKM值得到两个样本间的相关性。IP 项目中,如果实验与对照样本间相关性系数高,则说明两个样本中大部分reads在染色体上的分布情况类似,暗示实验样本结合的RNA/DNA的富集程度和特异性较低。

样本聚类分析

方法描述:在这部分分析中,根据样本相关性系数进行样本间聚类分析

四、结合峰分析

结合峰分析策略

方法描述:因为每个基因的表达量不同,定位在基因组一个位置上的CLIP-seq序列的多少无法评估该RNA结合蛋白在该位置上是否特异性结合。如何剔除基因表达量对RNA结合蛋白特异性结合信号带来的噪音,是分析CLIP-seq数据的一个关键点。MIT的Phillip A Sharp(因发现基因剪接获得过诺贝尔 奖获)实验室2009年一篇论文利用exon array转录本丰度作为参考,来消除表达量对AGO2蛋白所特异结合的mRNA位点的干扰(Chi, Zang et al.

2009)。理论依据是:转录本丰度低的mRNA在IP过程中被RNA结合蛋白抓下来的几率小,反之亦然

方法一:ABLIRC

我们要求用于分析的单位置比对序列(unique mapped read)彼此之间需要互相重叠,重叠区域至少为1nt。对选定的基因,根据定位到此基因的reads产生随机序列,对此基因进行模拟定位500次,找出500次中最大的随机序列高度(p-value<0.01)作为背景,如果此基因中最大的peak高度< 最大的随机序列高度,则认为该peak为noise,将其去除;反之,则将该peak保留为结合峰。

方法二:Piranha

根据测序深度和覆盖度选取某一固定长度(xx nt)为单位(bin)将基因组等分,统计每个bin中的reads数目。模拟数据中reads的分布情况,来作为背景噪音,然后基于zero truncated negative binomial (ZTNB) 来寻找reads分布显著高于背景的位置。在此过程中每个bin都会获得一个p-value,根据p-value进行显著性筛选,得到真实的结合峰(Uren, Bahrami-Samani et al. 2012)。

结合峰统计

方法描述:本项目使用上述策略,以input样本为背景,对实验样本的rmdup reads进行Peak Calling,得到实验样本特异的结合峰(peak)并进行统计,结果如下:

结合峰宽度统计

方法描述:对实验样本特异的结合峰的宽度进行统计,得到结果如下:

结合峰在参考基因组上的分布

方法描述:统计结合峰在参考基因组上各个区域的分布情况,统计结果如下:

结合峰重叠分析

方法描述:维恩图主要展示两次重复实验之间重叠的peak的数目。

结合基序分析

方法描述:我们用HOMER (Hypergeometric Optimization of Motif EnRichment)对实验样本特异的结合峰进行motif分析

结合峰相关基因聚类Gene Ontology 富集分析

方法描述:

1. 利用blast将参考基因组的基因序列比对到Gene Ontology数据库,进行GO注释;

2. 提取比对结果,作为背景即background;

3. 根据结合峰相关基因(peak associated gene)注释信息,统计每个基因所在的GO Term,根据每个Term的基因数目,以及背景中此Term 的基因数目,用超几何分布检验分析每个Term的显著性。

4. 选取排名前10的GO Term及其校正p-value和百分比图进行展示。

结合峰相关基因KEGG Pathway富集分析

方法描述:

1. 利用blast将参考基因组的基因序列比对到KEGG数据库,进行KEGG注释;

2. 提取比对结果,作为背景即background;

3. 根据结合峰相关基因(peak associated gene)注释信息,统计每个基因所在的KEGG pathway,根据每pathway的基因数目,以及背景 中此pathway的基因数目,用超几何分布检验分析每个pathway的显著性。

4. 选取排名前10的pathway及其校正p-value和百分比图进行展示。

CELF1 preferentially binds to exon-intron boundary and regulates alternative splicing in HeLa cells

CELF1 preferentially binds to exon-intron boundary and regulates alternative splicing in HeLa cells

RNA结合蛋白(RBPs)参与到了转录后调控,包括RNA的可变剪接,RNA的空间折叠,从而导致RNA的表达量的变化。因此精确确定RBPs在RNA上的结合位置和结合特点是至关重要的。目前已经有成功解析RBP结合位点的方法,如CLIP-seq。但CLIP-seq也有很多的缺陷:如实验复杂,成功率低,文库的丰富度不够。和CLIP-seq比较类似的RIP-seq,虽然少了一些步骤,但获得的结果和CLIP-seq比较类似。最近有一项研究报道,使用DO-RIP-seq技术,也可以成功地获得RBPs的结合位点。而且能够获得更好的丰富度,这为RIP-seq分析RBPs的结合位点提供了方案和依据。

Mitochondrial iron chelation ameliorates cigarette smoke–induced bronchitis and emphysema in mice

慢性阻塞性肺部疾病(Chronic obstructive pulmonary disease, COPD)是一种复杂,削弱肺部功能的疾病,主要临床和病理表现包括从气道炎症(慢性支气管炎),肺组织破坏(肺气肿)小气道重塑等(1,2)。COPD的发病机制至今仍然不明确,但是它涉及到肺部对香烟烟雾(cigarette smoke, CS)的异常炎症和细胞反应失调(1)。目前研究表明吸烟和遗传是COPD最大的危险因素(3)。本文作者之前通过对人类全基因组进行全基因组关联分析(genome-wide association studies, GWAS)确定IRP2(也称为IREB2)是COPD的主要候选基因(4-6),此后作者证明IRP2蛋白在COPD患者的肺部含量增加(4)。已有的研究表明IRP2基因位于人类15q25染色体上,该染色体上还包括编码烟碱乙酰胆碱受体的几个部件的基因。此外 GWAS分析表明15q25还与肺癌,外周动脉疾病和尼古丁成瘾相关(7-10)。铁调节蛋白(The iron-regulatory proteins, IRPs)IRP1和IRP2尤其是IRP2负责调节哺乳动物体内细胞铁离子的平衡(11)。IRPs在十二指肠,脊髓和中枢神经扮演非常重要的生理角色,同时IRPs也可能是肺动脉高压和神经性病变等疾病发病原因(12-15)。在细胞内铁耗尽的情况下,IRPs通过与位于mRNA上铁体内平衡基因的铁反应元件(iron-response elements, IREs)结合,导致其翻译被抑制从而降低铁的储存并同时增加铁摄取(12,15)。但是IRP2在肺部的生理功能以及IRP2的mRNA转录还不是很清楚,同时IRP2在肺部暴露在香烟烟雾中COPD发病的响应机制也不是很明确。因此,作者试图通过将COPD实验中小鼠模型和人COPD数据整合,阐述由香烟烟雾引起的COPD中IRP2的功能。