结直肠肿瘤是一种常见的消化道肿瘤,其中结直肠癌已成为世界上发病率排名第三及造成居民死亡排名第四位的恶性肿瘤。在我国常见的恶性肿瘤死亡病例中,结直肠癌也占有很高的比例,并且近几年其发病率有逐渐增加的趋势,严重影响了人民的身体健康。结直肠肿瘤的发生发展与遗传、生活方式及环境等多种因素相关,目前有研究表明肠道微生物与结直肠肿瘤的发生发展有密切的联系,但关于肠道微生物与结直肠肿瘤发生的确切关系尚不清楚。有两种关于肠道菌群与结直肠癌关系的假说,分别是“Alpha-Bugs”假说和“driver-passenger”假说。
目的:在本文中我们通过对来源于不同患者肠道黏膜的微生物进行分析,为了找出结直肠肿瘤不同阶段的肠道黏膜微生物的差异,同时我们还想寻找与结直肠肿瘤相关的黏膜微生物标记物。
方法:本文中所用到的的肠道微生物样本来源于2015年10月NatureCommunication上发表的一篇文献,样本的微生物序列是从NCBI的SRA数据库中下载得到的,所有的序列信息都是公开的。微生物序列经过去噪处理后,先利用UPARSE软件将所有的序列在95%相似度下进行聚类得到OTU,然后使用利用UCHIME将PCR扩增产生的嵌合体从序列中去除,最后我们筛选出每个OTU中的代表序列,将每个代表序列与数据库进行比对,最终得到每个OTU的注释信息。并对最后的OTU注释结果进行了优化,去除了注释信息为古菌和没有注释结果的OTU。最终得到了每个样本的OTU组成信息及微生物在门纲目科属种6个分类层面上的注释及组成信息。我们使用R语言分析样本的α多样性指数(包括chao1指数、shannon指数以及simpson指数),样本的主坐标分析,基于距离矩阵的多元方差分析和样本间的聚类分析,使用QIIME软件计算样本的β多样性指数(包括Bray-Curtis,weighted UniFrac和unweighted UniFrac距离),利用Kruskal-Wallis检验和Wilcoxon秩和检验比较组间α多样性和微生物各分类层面相对丰度的统计学差异,p值使用Benjamini-Hochberg法进行校正,校正后认为p值小于0.1具有统计学意义。最后我们使用LEfSe分析结直肠肿瘤发生发展不同阶段可能的微生物标志物。
结果:总共有160人入选本次实验,包括61位经肠镜检查确认肠道无肿瘤的患者,47位经病理确认为腺瘤的患者及52位病理确认为进展期结直肠腺癌的患者,并分别定义为正常组、腺瘤组和腺癌组。三组患者除了年龄上存在统计学差异(60.13±5.99,67.32±8.80,67.85±13.18,p<0.001),其他各项指标,包括活检的部位,一级亲属肠道肿瘤病史,吸烟饮酒史等均无统计学差异。
数据处理后我们一共得到了1012335条序列,平均每个样本含6327条。其中正常组61个样本总计338391条,平均每个样本含5547条,腺瘤组47个样本总计327500条,平均每个样本含6968条,腺癌组52个样本总计346444条,平均每个样本6662条。
我们对所有的序列在95%相似性下聚类,总共得到了605个OTU,平均每个样本含OTU63个,其中正常组共有445个OTU,腺瘤组共有417个OTU,腺癌组共有482个OTU。 OTU Rank曲线提示大部分样本的OTU数目在50-150之间,并且所有样本OTU的分布都不均匀。
我们发现α多样性指数中的chao1指数在三组间有统计差异(p=0.0006),而三组样本的shannon指数与simpson指数均无统计学差异(shannon指数:p=0.22,simpson指数:p=0.20)。我们使用PCoA来展现样本的β多样性,PCoA分析显示可以将腺癌组与正常组及腺瘤组分开,而正常组和腺瘤组的样本比较接近,很难分开,但三组样本间都存在不同程度的重叠。 PERMANOVA分析则显示三组样本的微生物组成存在显著差异。
我们使用数据库对OTU进行物种注释,得到了微生物在门纲目科属种几个层面上的组成信息,大部分OTU都可以注释到属水平上。在门水平上我们一共得到了12个门,其中腺瘤组有9个门,腺癌组有8个门,正常组有10个门,大部分微生物属于厚壁菌门(Firmicutes),拟杆菌门(Bacteroides),放线菌门(Actinobacteria)和变形菌门(Proteobacteria)四类。在科水平我们一共得到了94个科,其中平均相对丰度较高的物种包括肠杆菌科(Enterobacteriaceae)、拟杆菌科(Bacteroidaceae)、瘤胃菌科(Ruminococcaceae)和梭杆菌科(Fusobacteriaceae),其中正常组共有76个科,腺瘤组中共有75个科,腺癌组共有80个科。在属水平上我们一共得到了148个物种,平均相对丰度较高的物种包括拟杆菌属(Bacteroides)、埃希菌属(Escherichia)、梭杆菌属(Fusobacterium)和链球菌属(Streptococcus),其中正常组共有117个属,腺瘤组共有117个属,腺癌组共有125个属。
我们使用Wilcoxon秩和检验发现,无论是在哪个物种层面上进行比较,正常组和腺瘤组的各个物种的丰度均无统计学差异。正常组与腺癌组的物种相对丰度在各个层面上均有统计学差异。在门水平上,放线菌门(Actinobacteria,p=0.01)和变形菌门(Proteobacteria,p=0.001)在正常组中升高,厚壁菌门(Firmicutes,p=0.07)和梭杆菌门(Fusobacteria,p=0.008)在腺癌组中升高。在属水平上共有16个属具有统计学差异,酸单胞菌属(Acidomonas)、Blautia、埃希菌属(Escherichia)、Faecalibacterium、假单胞菌属(Pseudomonas)、鞘氨醇单胞菌属(Sphingomonas)等在正常组中升高,而弯曲杆菌属(Campylobacter)、戴阿利斯特杆菌属(Dialister)、艾肯氏菌属(Eikenella)、梭杆菌属(Fusobacterium)、乳酸杆菌属(Lactobacillus)、纤毛菌属(Leptotrichia)、Mogibacterium、微单胞菌属(Parvimonas)、消化链球菌属(Peptostreptococcus)和普雷沃氏菌属(Prevotella)在腺癌组中升高。腺瘤组与腺癌组相比共有21个属具有统计学差异,其中酸单胞菌属(Acidomonas)、不动杆菌属(Acinetobacter)、水栖菌属(Enhydrobacter)、埃希菌属(Escherichia)、假单胞菌属(Pseudomonas)、鞘氨醇单胞菌属(Sphingomonas)和葡萄球菌属(Staphylococcus)等物种在腺瘤组中显著升高,而Bulleidia、弯曲菌属(Campylobacter)、脱硫弧菌属(Desulfovibrio)、戴阿利斯特杆菌属(Dialister)、梭杆菌属(Fusobacterium)、纤毛菌属(Leptotrichia)、Mogibacterium、Odoribacter、颤螺菌属、微单胞菌属、消化链球菌属、卟啉单胞菌属、普雷沃氏菌属和密螺旋体属等物种在腺癌组中显著升高。
我们使用LEfSe分析结直肠肿瘤发生发展不同阶段可能的微生物标志物,其中正常组的微生物标记物包括Actinobacteria、Actinomycetales、Moraxellaceae和Sphingomonas等, Alphaproteobacteria、Bacillales、Escherichia coli、Proteobacteria、Pseudomonas和Staphylococcus等在腺瘤组为优势菌种,腺癌组的微生物标记物主要有Bacilli、Bacteroides_fragilis、Firmicutes、Fusobacterium、Strcptococcaccae、Parvimonas和Prevotella等。
最后我们利用β多样性中的unweighted UniFrac距离对所有的样本进行聚类分析,聚类方法为UPGMA,发现并非每个组的样本都能聚到一起,这说明了样本的个体间存在差异。
结论:本文对肠道黏膜微生物的测序序列进行OTU和物种注释的分析,表现了结直肠肿瘤发生发展的不同阶段的黏膜微生物的变化。腺癌组的黏膜微生物与正常组和腺瘤组相比,差别较大,通过主坐标分析能将腺癌组与另两组分离开。其中具有直接致癌的物种,如梭杆菌属和脆弱拟杆菌的丰度升高,具有抑制肿瘤发生的物种,如Faecalibacterium prausnitzii和Blautia的丰度则降低。正常组与腺瘤组的黏膜微生物比较接近,用主坐标分析很难将两者分开,并且在各个分类层面上两者的物种比较均无统计学意义,说明有其他混杂因素存在,需要进一步分析这些因素。本次研究使用了LEfSe筛选了各个组的标志物,各个组的标志物均有不同,说明在结直肠肿瘤发生发展的过程中肠道微生物发生了较大的变化,肠道微生物可能在肿瘤形成过程中起到了一定的作用。大肠杆菌在腺瘤组中高于腺癌组,表明大肠杆菌在肿瘤发生的早期发挥作用,在肿瘤发展的后期被其他更适宜肿瘤微环境的微生物所取代,这从一个方面证明了肿瘤与微生物关系的“driver-passenger”假说。