1.文章简介
文章题目 | Whole-genome mutational landscape and characterization of noncoding and structural mutations in liver |
中文题目 | 肝癌全基因组非编码区和染色体结构变异特征解析 |
期刊名 | Nature Genetics IF: 29.352 |
发表时间 | 2016 |
实验材料 | 300名肝癌患者的癌与癌旁组织 |
测序平台 | HiSeq 2000 |
相关产品 | 转录组测序 |
2.研究背景
肝癌是世界范围内发病率排名第五、死亡率排名第三的恶性肿瘤。肝癌发病通常与乙型或丙型肝炎病毒感染相关,但同时也可能由过度饮酒、代谢疾病或与致癌物质接触引发。现有研究成果已鉴定出大量与肝癌发病相关的蛋白质编码基因突变、与肝炎病毒感染相关的调控序列突变,以及染色体结构变异(STV)。研究者们希望通过大规模基因组测序和RNA-seq,更全面的鉴定与肝癌发病相关的STV和非编码区域突变。
3.研究内容
通过对300名肝癌病人的全基因组测序,鉴定了在肝癌中高频率发生突变的病毒整合位点、蛋白质编码位点、非编码位点和染色体结构变异位点,并研究了这些突变位点与已知致癌与抑癌基因的相互作用,为更好的肝癌预后提供依据。
4.研究方法
取样:300名肝癌病人的癌与癌旁组织。
全基因组测序和RNA-seq:采用HiSeq 2000平台2×100双端策略进行测序。
5.研究成果
1.全基因组测序鉴定肝癌患者蛋白质编码基因突变和肝癌病毒整合位点
研究者们通过全基因组测序鉴定了300名肝癌病人的DNA突变位点和频率,图1总结了若干重要突变特征在不同病人中的分布。在乙肝阳性(HBV+)的87名患者中,平均检出9,781个点突变,271个插入缺失突变,40.6个染色体结构变异,和2.5个乙肝病毒整合位点。点突变数量与患者年龄、肿瘤大小及吸烟频率正相关。通过非负矩阵分解(Non-negative matrix factorization, NMF)算法,研究者们在原发性肝癌(HCC)患者中鉴定出7类突变特征(图2)。研究者们在基因组上检测到多个HBV、HCV病毒整合位点,常见致癌基因也被检测到大量突变事件。
研究人员分析了在已注释基因组非编码区域出现的肝癌特异突变,在29个区域找到了大量高频率突变。这其中突变频率最高的是TERT启动子区域,此外6个已知的基因间区lncRNA基因(包括NEAT1和MALAT1)、10个启动子区域(包括TFPI2启动子、MED16启动子和WDR74启动子)和9个UTR区域(包括BCL4和AFF4的UTR)(图3)。
研究人员进一步在全基因组中搜索突变集中的区域,一共鉴定出87个高频突变区域。其中WDR74启动子区和MED16启动子区的突变会对其基因表达造成显著影响,而其他一些区域的突变可能影响转录因子结合位点(图4)。
与点突变不同,肝癌患者中不同类型的染色体结构变异的频率与其在细胞周期中染色体复制先后相关联。例如,串联重复(tandum duplication)多发生在染色体先复制的区域,而染色体缺失(deletion)多发生在后复制的区域(图5)。研究者们也分析了STV对基因表达的影响。一类STV可能通过改变基因结构影响表达,如LRP1B、TERT、CDKN2A、CCND1、MACROD2和TTC28,均在编码区域检出STV。另一类STV可能通过改变基因与增强子之间的距离或改变基因拷贝数影响基因表达,如TERT的表达与16种STV事件有关(图5)。
通过基于网络的分层策略(network-based stratification),研究者们鉴定除了多个突变簇(cluster),其中6个表现出癌症驱动基因(driver gene)突变的特征。根据驱动基因的差异,第1类(特征为ARID2和PBRM1突变)和第6类(TP53突变)患者通常预后较差,而第3类(MACROD2突变)患者预后较好。
原文出处:
Fujimoto, A., Furuta, M., Totoki, Y., Tsunoda, T., Kato, M., Shiraishi, Y., … Nakagawa, H. (2016). Whole-genome mutational landscape and characterization of noncoding and structural mutations in liver cancer. Nature Genetics, (April), 1–13. doi:10.1038/ng.3547.