生信分析吧 关注:137贴子:399
  • 0回复贴,共1

干货分享 | 什么是肿瘤克隆进化分析?

取消只看楼主收藏回复

肿瘤这个大杀手,至今依然是人类健康的巨大威胁。人们孜孜不倦地探索,却依然没有解开它的全部秘密。但至今的研究,已经让我们了解到肿瘤是一个具有强烈时空异质性的细胞集合,也提供了许多工具,帮助我们分析这些异质性。对瘤内异质性的分析,能帮助医生为患者制定更好的治疗策略,让他们更可能恢复健康。http://phoenix.tongshugene.net
1. 肿瘤的异质性
分子诊断和测序技术的发展已经帮助我们理清了许多癌症复杂的遗传组成。在人群中,肿瘤异质性可以粗略划分为瘤间异质性和瘤内异质性。瘤间异质性主要指不同的患者,即使发生了同一类型的肿瘤也会表现出各不相同的特点。这一现象已久为人知,主要是由个体间的基因背景、体细胞突变谱和生活的环境不同等因素引起。
另一类瘤内异质性是随着基因组学的发展才渐为人知的,它主要是说人们发现一个病人不同肿瘤或同一个肿瘤不同癌细胞间也有许多差异的现象。瘤内异质性又可以细分为空间异质性和时间异质性。空间异质性是指肿瘤内部不同的细胞亚群间的遗传背景并不完全相同的现象。时间异质性则指每个肿瘤随着时间变迁也会展示出动态的遗传多样性。

图1. Nat Rev Clin Oncol . 2018 Feb;15(2):81-94.doi: 10.1038/nrclinonc.2017.166.
2.克隆的进化
这些出现在肿瘤组织内的各自不同的细胞亚群,我们可以称之为克隆或叫亚克隆。克隆的产生与肿瘤的进化密切相关。
在一切的开始,肿瘤细胞的祖先只是众多正常细胞的一员。但随着一个不同寻常的癌突变的产生,它的命运发生了改变,它获得了生存优势,可以自我增殖,不断地分裂增加后代。在这个过程中,它的后代又不断地复制繁殖,产生新的突变,渐渐的它们逃脱了生长抑制和死亡通路,可以诱导血管生成。
最终,它们发动了组织侵袭和远端转移的程序,布满了患者的全身,让又一个生命走向落幕。
癌细胞的基因组极为不稳定,它们的发生过程并不遵循固定的路径,只要破坏了几个重要细胞通路的功能就能被称为癌细胞。甚至在转化成恶性肿瘤后,癌细胞依然处于动态和进化过程中。
这种持续不断和多种路径的进化下产生的肿瘤,拥有分子上的异质特性。虽然同被称为癌症细胞,它们却各自怀有截然不同的分子特征,对抗癌治疗也有不同的敏感程度。

图2. Nat Rev Clin Oncol . 2018 Feb;15(2):81-94. doi: 10.1038/nrclinonc.2017.166.
3. 克隆进化分析
人们为了研究瘤内异质性,开发了许多计算方法。
亚克隆重建过程涉及三个关键方面:
1 它会通过测序结果中的体细胞突变信息识别肿瘤中的主要细胞群体(即克隆)。
2 它会计算每个克隆内细胞在整个肿瘤中所占的比例(即cellular prevalence)。
3 它会重建各个克隆间的进化路径,阐释不同克隆是如何从他们的共同祖先以至更早的正常细胞进化而来。
亚克隆重建可以采用来自一个或时间/空间相异的多个肿瘤样本的DNA测序数据进行分析。
大部分亚克隆重建方法基于单碱基突变(SNV)、小的插入/缺失突变(indels)及大的拷贝数变异(CNAs)信息来进行计算。
算法根据测序结果的特征重构各位点的拷贝数状态,以及确定主克隆及亚克隆区域的拷贝数变化。然后,根据这些拷贝数变化信息及各个SNV的突变等位基因频率(VAF)来推断样本中携带该突变的细胞比例(cellular prevalence, CP)。
之后,算法会将CP值相似的SNVs聚类到一组,认为这些突变发生在一个特有的克隆中。如果知道样本中肿瘤细胞的比例(即purity),也可以根据携带各SNVs的肿瘤细胞的比例(即cancer cell fraction, CCF)对SNVs进行聚类,得到各SNVs所属克隆的信息。得到这些信息后,一些算法会根据聚类后各簇突变的CCF以及突变间的共同发生情况,尝试去推断各克隆间的进化关系。但这种推断一般只有在取得多个肿瘤样本的情况下,才有一定的参考意义。

图4. Nat Methods. 2021 February ; 18(2): 144–155. doi:10.1038/s41592-020-01013-2
克隆进化分析的影响因素
亚克隆重构的的分辨率和准确性受到取样方法的强烈影响。如果只采一个肿瘤样本,即使测序深度很高,也会低估亚克隆的数目,还会把亚克隆突变错认为主克隆。
多点取样通过比较不同样本间CCF的差异,提升对亚克隆的分辨能力,也有助于克隆间进化情况的推断。增加测序深度可以增强CCF估算的准确度,因而也有助于提高对亚克隆的分辨能力。但总体来说,在测序深度已满足识别突变及区分CCF峰的状况下,测更多的样本比增加测序深度更有益于提升亚克隆分析的准确程度。
对于测序总体覆盖度及测序技术的选择,一个有益的标准是单位肿瘤染色体拷贝读长数(NRPCC,reads per tumor chromosomal copy)。在泛癌单样本研究中,多数样本NRPCC大于10时至少会得到1个亚克隆。NRPCC等于10相当于在一个二倍体50%纯度的肿瘤样本中进行约40x深度的测序。
但随着肿瘤样本倍性的提高,测序深度也就相应增加。对配对对照样本进行测序可以减少识别出的体细胞突变的假阳性,对于提高克隆进化的准确性也很有益。除了测序深度之外,提高测序覆盖的基因组区域比例,也有助于亚克隆重建。30~50x的WGS测序可以获得比WES更高质量的CNA检测,并且可以检出比WES多50倍的SNVs和indels。更高质量的CNA结果及更多的SNVs和indels均有助于克隆进化的推断。
因为WES可以测得更高的深度以提高亚克隆分析的准确度,一般来说WGS和WES测序数据均可以用来进行亚克隆进化分析。而靶向测序数据因为覆盖区域太少,很难得出有意义的亚克隆分析结果。
另外亚克隆分析的样本最好使用新鲜组织进行测序。FFPE因为DNA质量不齐且容易产生CNA结果错误,可能会影响分析结果准确性。

图5. Nat Methods. 2021 February ; 18(2): 144–155. doi:10.1038/s41592-020-01013-2
为了细致了解肿瘤克隆进化细节及深度挖掘数据,桐树基因搭建了phoenix生信分析云平台http://phoenix.tongshugene.net 根据模板一键上传数据并选择克隆进化分析流程,系统将会自生成分析流程,并提供结果报告及结果文件。
Phoenix生信分析云平台既可以存储繁杂的测序数据和临床信息,又提供基础/高级分析、及个性化分析服务,支持深度分析组学大数据发现新生物标记物,绘制可发表级美图。用户只需向平台提交从测序公司得到的原始数据及样本基本信息,就可以得到分析后的原始结果文件及包含各种常规分析图表的结果报告。同时Phoenix生信分析云平台提供专业级测序文件及相关信息存储管理服务,根据模板要求一键上传,您的数据再多也不会乱。


IP属地:山西1楼2023-02-23 14:44回复