1.CLIP-seq建库流程
2.CLIP-seq分析流程
3.CLIP-seq详细分析流程
3.1 数据基础分析:
- 测序质量分析;
- 测序有效长度分析;
- cDNA文库的代表性分析。
3.2 全基因组定位分析:
- Reads与参考基因组比对分析;
- Reads在基因组不同区域分布情况;
- Reads的Rfam分类分析;
- Reads在gene/mRNA区分布分析;
- Reads在转录起始位点(TSS)附近的分布分析;
- Reads在转录终止位点(TTS)附近的分布分析;
- Reads在翻译起始位点(Start codon)附近的分布分析;
- Reads在翻译终止位点(Stop codon)附近的分布分析。
3.3 CLIP-seq高级分析:
在这部分分析中,我们开发的分析策略为:In silico random IP(仅使用unique reads进行分析,见下图)。对选定的基因中,根据定位到此基因的observed tag number with observed length产生随机序列,对此基因进行模拟定位500次,找出500次中maximal random tag height (p_value<0.01),如果此基因中observed max peak height
3.4 高级分析主要包括:
- 基因组上结合峰(peak)分布情况;
- 结合峰的峰宽分析;
- 结合峰的峰间距分析;
- IP样本特异结合峰(specific peak)分析(与对照样本相比较);
- 结合基序(motif)分析;
- 结合峰所在基因分析;
- 结合峰所在基因的GO分类分析;
- 结合峰所在基因的功能聚类分析(DAVID);
- 结合峰所在基因的GO富集性分析;
- 结合峰所在基因的KEGG分析。