毫不夸张地说,可变剪接的多样性是构成真核生物体复杂的生物学过程和细胞多样性的重要基础……因此,更好地描述AS整体特征,更全面地量化特定状态下的这些特征,以及AS变化的特点,对于理解AS在生理和病理状态下的作用至关重要。
我们开发出了独立自主的AS分析软件:剪接位点使用变异分析(SUVA)。SUVA在检测AS事件方面显示出比其他方法更高的灵敏度和准确性。
文章简介
文章题目 | SUVA: splicing site usage variation analysis from RNA-seq data reveals highly conserved complex splicing biomarkers in liver cancer |
中文题目 | SUVA:RNA-seq数据的剪接位点使用变异分析揭示肝癌中高度保守的复杂剪接生物标记物 |
期刊名 | RNA Biology(IF: 4.652) |
作者 | Chao Cheng, Lei Liu, Yongli Bao, Jingwen Yi, Weili Quan, Yaqiang Xue, Luguo Sun, and Yi Zhang |
发表时间 | 2021 |
实验材料 | TCGA肝癌RNA-seq数据,SUVA分析软件 |
相关产品 | RNA-seq,大数据分析挖掘 |
研究背景
研究内容和结果
在SUVA的工作原理中,根据剪接位点的使用变化情况定义了五种不同类型的AS事件模型(图1a)。每种类型包含两个成对的剪接接头(SJ);SUVA通过识别这些成对的剪接接头来进行统计和分析。在SUVA的工作流中,共有5个工作模块:准备(Prepare)模块,NIR模块,IR模块,经典AS事件注释模块,以及最后的显著差异AS事件模块(图1b)。五种模块流程化分析,最终可以鉴定出不同样品组中发生显著变化的AS事件。图1c则介绍了构建四种NIR类型(alt3p、alt5p、olp、contain)的SJs集和剪接模式簇,以及到量化和差异分析的详细信息。
图1:SUVA对可变剪接事件的定义,以及主要的工作原理。
最让人兴奋的是,SUVA对于复杂的AS事件检出率和准确率都比其他的AS分析软件要高。复杂AS事件指的是预定义剪接模型内的一个或多个剪接位点与模型外剪接位点配对的情况,如图2a所示。对于复杂的AS事件,SUVA具有化繁为简的能力;通过重新定义的5种可变剪接类型,以及算法上的优化,SUVA采用了一种简化的方法来定义AS事件,从而能够根据剪接位点的使用频率对每个AS进行更精确的量化。图2c-d是SUVA对一个复杂AS事件的分析和检测结果,以及对复杂AS事件化繁为简的模型图展示。
为了检测SUVA在AS事件分析和检出中的优势,我们对比了其他几种AS分析的工具软件,包括rMATS,SUPPA2和LeafCutter。我们在相同的数据集上运行了SUVA、rMATS、SUPPA2和LeafCutter软件,以生成差异改变的剪接事件。通过这些仿真测试和接收机工作特性(ROC)曲线,我们发现SUVA在四种情况下都优于其他三种方法(图4a-d)。当把FDR固定为0.05时,SUVA和LeafCutter可以检测出比其他两种软件更多的可变剪接事件。同时当转录本包含10个以上不同SJ使用的剪接位点时,SUVA检测到的可变剪接事件则比LeafCutter多(图4e)。这一观察结果表明,与RMAS、SUPA2和LEVECURTER相比,SUVA的真阳性率较高,假阳性率较低,尤其是在剪接复杂度较高的情况下。
最后,我们使用SUVA软件分析了一组肝癌(LIHC)数据,发现了FN1基因中的复杂可变剪接事件在癌组织和癌旁组织中发生了显著差异变化。FN1基因的表达也在癌组织和癌旁组织中发生了显著差异变化(图6a),且和患者预后关联。SUVA在FN1基因中检测到了五个高频信号(≥50%样本)和主要(pSAR≥50%)的肿瘤特异性RAS事件(图6b-c)。为了检测FN1中关键的癌症特异性RAS事件是否可以作为LIHC患者的预后因素,我们将剪接比率与LIHC患者的总生存率相关联,发现clualt5p108426的AS比率是预测生存概率的最有力因素(图6d)。这些研究表明,肿瘤特异性选择性剪接和肿瘤中FN1的调控网络可能在肝癌的发生中发挥重要作用,并可被视为潜在的预后生物标志物和治疗靶点。
总结
总之,SUVA是检测、定义和量化转录组数据多种AS的有效方法,特别是复杂AS事件,它可以有效地发现新的AS事件,并作为癌症生物标记物和治疗靶点。我们的方法和结果将有助于进一步探索AS调控机制和复杂AS在动物和人类疾病各个方面生物过程中的作用。
【 TIPs:】
如果你刚好有高通量转录组数据,正发愁如何分析或苦于功能聚类差异基因分析不够出彩,那么赶紧尝试可变剪接分析,请联系我们!
了解服务详情可浏览官网 [ 大数据产品 ] 版块。