在线客服
客服热线
400-664-9912
客服组:
阿趣客服
客服组:
在线客服
QQ:
Amy
服务时间:
8:00 - 24:00

关注官方微信平台

电话:400-664-9912

QQ:2850277929

邮箱:marketing@biotree.cn

地址:上海市嘉定区新培路51号焦点梦想园B栋5楼

上海阿趣生物科技有限公司. 版权所有 沪ICP备17019578号-1

Nature | 血液和组织的微生物组分析提示癌症诊断方法

分类:
阿趣动态
发布时间:
2020/04/30 14:34
浏览量
 
 
癌症是一种人类基因组疾病。调查结果显示, 2018年全球癌症新发病例1810万例, 死亡960万例,癌症仍是威胁人类生命健康的主要病症之一。癌症早期患者的治愈率比晚期患者更高,早期诊断是战胜癌症的有效途径之一,能够降低治疗难度和成本,提高患者的生活质量。
 
人体内有两个基因组,其一是人类基因组,其二是出生后才进入人体的微生物组,它们占人体基因总和的99%,与人类健康有着千丝万缕的联系。近来的研究表明,微生物群与某些癌症关系密切,可能通过促进黏膜炎症或引起全身失调直接致癌,同时在调节癌症免疫治疗反应中起作用,肿瘤微环境中微生物群落有助于提高治疗效果。然而,微生物在不同类型癌症中的作用途径和诊断意义尚不清楚。
 
 
代谢组学
 
 
近日,来自美国加州大学圣地亚哥分校的RobKnight团队在Nature上的一篇文章,重新检查了癌症基因组图谱(TCGA)中33种癌症的全基因组和全转录组测序研究,在多数癌症的组织和血液中发现了独特的微生物特征。基于这些数据,构建了机器学习模型,通过微生物组数据对癌症进行诊断和分型。并通过59例前列腺癌(Prostate Cancer,PC)患者,25例肺癌(Lung Cancer,LC)患者,16例黑色素瘤(Melanoma,SKCM)患者和69位健康志愿者进行验证。
 
 
1
数据获取和预处理
 
研究团队从TCGA中获得原始数据,经Kraken软件快速筛选微生物来源的序列(图1a)。对这些微生物进行质量控制严格筛选,并按癌症类型和样本类型内的样本数进行标准化(图1b)。针对快速k-mer方法容易产生假阳性结果的问题,对四种具有已知微生物关系和成对蛋白质组数据的TCGA类型的癌症,进行了较慢但可能更具体的基因组比对。使用Voom实现了一个将离散的分类计数转换为每百万个样本的对数计数(log-cpm),并执行了监督规范化(SNM)。主方差成分分析表明,标准化降低了批次效应,同时增加了生物信号(图1c,d,e)。
 
 
代谢组学
图1.TCGA癌微生物群分析的方法和总体结果
 
 
2
癌症分型分期
 
利用标准化数据,训练随机梯度增强ML模型来区分癌症的类型和阶段。这模型在区分(i)一种癌症类型与所有其他癌症类型(n=32)和(ii)肿瘤与正常癌症类型(n=15)方面表现良好(图2f,g)。为了评估该方法在数据集中的通用性,将原始TCGA微生物计数随机分为两批,分别对每一批进行重复所有程序,在另一半数据上测试每一个独立训练的模型,发现了高度相似的性能。为了进一步验证,研究者使用了SHOGUN31,一个基于比对的微生物分类管道,一个简化的,基于系统发生学的,仅针对细菌的数据库,对13517个TCGA样本进行了分析,涵盖了每种癌症类型(n=32)、样本类型(n=7)、测序平台(n=6),以及基于Kraken分析的测序中心(n=8)。总之,结果意味着微生物群落对于每一种癌症类型都是独特的,并且标准化方法和仅基于微生物图谱的癌症识别模型训练可以被更广泛地应用。
 
 
代谢组学
图2.诊断模型性能指标热图
 
 
3
生物学相关性验证
 
考虑到微生物特征的强大辨识力,研究者希望从微生物来源和临床病理特征来寻找其与癌症具有生物学相关性的证据。基于Source Tracker 2的贝叶斯算法,对微生物来源进行分析(图3a)。发现梭杆菌属(Fusobacterium spp.)在胃肠道肿瘤的发生发展中尤为重要,与固体组织正常样本特别是血源性样本相比,原发肿瘤中梭杆菌过多(图3b)。总之,这些数据与该模型在一种癌症类型与所有其他癌症类型之间提供的特征重要性信息一致,证明模型与生态相关。这些发现为病毒和细菌数据的生物信息化和标准化方法提供了生态学验证,同时将结果扩展到更多的样本和微生物。
 
 
代谢组学
图3.TCGA癌症微生物群数据集中病毒和细菌读数的生态学验证
 
 
4
去污分析
 
为了最好地描述假定的癌症相关微生物。研究者使用了非常严格的去污分析,丢弃了高达92.3%的总序列数据(图4)。污染物如果不加以控制,可能会限制生物学结论,特别是在小型研究中。但是,严格去污的另一个风险是,反映共生、组织特异性微生物群落和伴随癌症的预测性微生物分布的真实信号可能被丢弃。为了评估这一问题,研究者重新计算了所有ML模型,并比较了它们在每次净化方法前后的性能。和预期一样,在组织类型丰富的情况下的对比经过严格的净化处理通常表现得不太好,但在组织内部的比较通常表现得更好。这些结果表明,严格的过滤在某些比较中可能是可取的,但一种普遍的去污方法可能会排除生物信息结果。
 
 
代谢组学
图4.去污方法
 
 
5
血液微生物诊断癌症
 
越来越多的证据表明,血源性微生物DNA(mbDNA)可以在癌症中提供临床信息,但目前尚不清楚这一点的适用范围有多广。利用TCGA血液样本中的数据,将机器学习(ML)策略应用于完整数据集和四个净化数据集,发现血液中的mbDNA可以区分多种类型的癌症(图5a)。因此,将ML模型与现有的循环肿瘤DNA(ctDNA)分析进行对比,重点关注ctDNA分析失败的情况:Ia-IIc期癌症和肿瘤。结果,这些TCGA血型特征在应用于Ia-IIc期癌症患者仍然具有预测性(图5b)。进一步使用Guardant360和FoundationOne液体分析的基因列表,筛选出具有一个或多个靶向修饰的TCGA患者,并发现相同的机器学习方法对大多数剩余类型的癌症显示出良好的区分性(图5c,d)。
 
 
代谢组学
图5.血液mbDNA构建的诊断模型性能热图
 
 
6
验证血液中的微生物特征
 
为了证明这些结果的真实效用,以59例前列腺癌患者,25例肺癌患者,16例黑色素瘤患者和69位健康志愿者为样本,评估了血浆来源的脱细胞mbDNA信号用于区分健康人和多种癌症。除了最小的SKCM队列外,在健康样本和癌症类型之间的成对和多类别比较中发现了很高的区分性(图6)。
 
 
代谢组学
图6.两类和多类癌症诊断模型
 
 
7
总结
 
文章提供了迄今为止最全面的癌症微生物组数据集,系统地检查并减轻了技术变化和污染的影响,结合ML来识别区分不同癌症的微生物特征。结果表明,不同类型的癌症内部和之间,都和特定的微生物群之间存在广泛的联系。这种新的基于微生物组的癌症诊断工具可能会带来巨大的价值,可以补充现有的ctDNA检测方法,用于检测和监测癌症。
 
参考文献:
Gregory D. Poore,et al.Microbiome analyses of blood and tissues suggest cancer diagnostic approach.[J].Nature 2020 03;579(7800).
 
文献下载链接:
链接:https://pan.baidu.com/s/1d9XQK2EZI4FpueD1O_mO7w
提取码:7y1r
复制这段内容后打开百度网盘手机App,操作更方便哦
 
代谢组学
>
>
>
Nature | 血液和组织的微生物组分析提示癌症诊断方法