微生物|杜克大学沈西凌团队利用大数据比较分析方法阐明癌症微生物组图谱

尽管微生物群组研究不断扩展,但由于难以获得临床活检组织,研究内部器官的微生物组成及其与疾病的关系仍然具有挑战性 。
《癌症基因组图集》(TCGA)中的测序数据包含人类各器官肿瘤和微生物基因组的测序片段信息 。最近,对TCGA测序数据的分析已被用来证明血液微生物DNA具有诊断某些癌症的潜力 。由于肿瘤微生物组对肿瘤类型具有高度特异性,因此利用TCGA测序数据中对微生物DNA和RNA的分析,在诊断应用以及探索分子和临床相关的宿主-微生物相互作用方面具有巨大潜力 。
然而,这些数据集的分析受到污染微生物遗传信息的困扰 。污染主要来自于样品的加工,处理和测序等环节,在低生物量组织样本中污染微生物遗传信息相对更加丰富,以至于不能真实的揭示癌症是如何影响微生物组的 。
北京时间2020年12月31日凌晨0时,美国杜克大学生物医学工程系沈西凌教授团队在Cell Host & Microbe杂志发表论文,题为“The cancer microbiome atlas: a pan-cancer comparative analysis to distinguish tissue-resident microbiota from equiprevalent contaminants” 。
微生物|杜克大学沈西凌团队利用大数据比较分析方法阐明癌症微生物组图谱
文章图片

在沈西凌教授的指导和带领下, 实验室的研究生Anders Dohlman设计了一个大数据分析模型,用于分析《癌症基因组图集》(TCGA)中跨样本类型的微生物种表达和分布情况,揭示出在不同器官样本中都存在的微生物种主要是污染微生物 。
研究中还发现不同的测序中心(哈佛大学, Baylor实验室, Broad研究所) 都有其独特的污染微生物信息 。去除此类微生物种可减轻批次效应,并分离出组织驻留的微生物组 。这种分析的结果已经过匹配的TCGA样品进行了验证 。
【微生物|杜克大学沈西凌团队利用大数据比较分析方法阐明癌症微生物组图谱】微生物|杜克大学沈西凌团队利用大数据比较分析方法阐明癌症微生物组图谱
文章图片

基于以上的研究,沈西凌教授团队发表了全新的癌症微生物组图谱(TCMA) 。新的TCMA数据库具有以下优点:
1. 将TCGA微生物组数据分离为组织固有的和污染微生物部分 。
2. 通过基因,序列和核苷酸分辨率区分“混合证据”物种,例如大肠杆菌 。
3. 经过去污染微生物净化算法, 该数据库包含针对来自1,772名患者的3,689个胃肠道癌样品的去污微生物图谱 。
微生物|杜克大学沈西凌团队利用大数据比较分析方法阐明癌症微生物组图谱
文章图片

TCMA构成了在与癌症相关的宿主-微生物相互作用的未来研究中进行验证和产生假设的强大资源 。虽然现有的经过净化处理的微生物成分的集合只揭示口咽、食道、胃肠道和结直肠组织的肿瘤相关微生物组的信息,但是类似的去污分析可用于扩大微生物分析在各种器官和相关疾病中,更增加了公共NGS数据的可用性 。
这将有助于指导微生物组在人类健康和疾病中作用的进一步研究 。
相关论文信息:
https://doi.org/10.1016/j.chom.2020.12.001
编辑 | 余荷
排版 | 王大雪
欲知更多内容,敬请围观小柯机器人频道:
http://paper.sciencenet.cn/AInews/
“小柯”是一个科学新闻写作机器人,由中国科学报社联合北大团队研发而成 。新闻由“小柯”独立完成,经领域专家和科学编辑双重人工审校和信息补充 。“小柯生命”是“小柯”系列学术公众号之一,主要介绍生命科学领域顶级学术期刊最新论文信息 。

    推荐阅读