首页 > 基因组学 > 多菌株差异比较分析

多菌株差异比较分析

随着快速、经济的微生物基因组测序技术的发展,大量的微生物基因组数据被公布。可以利用全基因组水平的基因扫描和等位基因信息等对菌种进行差异菌株分析。差异菌株分析在研究样本菌株在群体进化或分子流行病学方面的关系有广泛应用。微基生物对细菌基因组测序提供以下多菌株差异比较分析服务。

结果展示

1) CARD数据库比对分析

The Comprehensive Antibiotic Resistance Database http://arpcard.mcmaster.caCARD 数据库核心是 ARO(Antibiotic Resistance Ontology)ARO 包含了与抗生素抗性基因,抗性机制,抗生素和靶相关的termCARD 数据库是目前应用广泛的耐药基因研究工具。


图片23

抗性基因热图

2) VFDB数据库比对分析

毒力因子数据库 VFDB http://www.mgc.ac.cn/VFs/main.htm)由中国医学科学院研发,被广泛应用于毒力因子基因鉴定。 该数据库目前已涵盖74个属,一千余个致病因子,三万多条基因序列。是目前公开的、细菌致病因子应用广泛的数据库。


图片24

3) MLST分析

MLSTMulti-locus sequence typing)多位点序列分型是常用的基因分型方法。通过PCR扩增6~10个管家基因内部片段,测定其序列,得到等位基因编号,然后进行等位基因图谱(allelic profile)或序列类型(sequence typesSTs)鉴定,再根据等位基因图谱使用配对差异矩阵(matrix pair-wise differences)等方法构建系统树图进行聚类分析。


图片25

MLST 最小生成树

4) cgMLST分析 

cgMLST (Core Genenome multi locus sequence typing) 核心基因组多位点序列分型是基于全基因组的核心靶基因进行序列分型,在现有的MLST数据基础上,以大量菌株中存在的核心基因组作为序列分型标记。cgMLST的标记位点多,密度高,其对菌株之间的细微变异也更为敏感,进一步提高了结果的精确度和准确性。将菌株分型鉴定的分辨率拓展到克隆级别。

细菌cgMLST分型有助于菌株进化研究,感染的早期发现、耐药菌株溯源和传播途径甄别,在菌株进化研究、流行病学溯源调查等方面均表现出。


图片26

cgMLST 最小生成树

5 )SNP分析

SNP Single Nucleotide Polymorphism,主要是指在基因组水平上由单个核苷酸的变异所引起的DNA序列多态性,包括单个碱基的转换、颠换等。使用核心基因的SNPcgSNP)信息构建系统进化树,分辨率最高,但只适合特别近的菌株。


图片27

6) 泛基因分析

泛基因组即某一物种全部基因的总称。对各个样本中的不同类型的基因占比进行统计,从而对样本中基因的结构类型有宏观的把控。泛基因组分为核心基因组(core genome)、可变基因组(dispensable),特有基因 (unique  genes)。其中unique gene为样本特有基因,一般与该样本特有的表型、特有的适应性等区别于其他样本的特征相关;dispensable gene为样本中的附属基因,这部分基因形成了群体的遗传多样性;core gene为所有样本共有的基因,与群体共有或基本特征相关,形成了某类物种特有的表型或者属性。

 

图片28

核心基因家族的统计

图片29

同源基因家族的分布统计

图片30

各样本同源基因的分布统计

7) 系统进化分析

GTDB(GENOME TAXONOMY DATABASE)这一分类系统以细菌中普遍存在的120个单拷贝蛋白质(bac120)为基础;在对多分组类别消歧后,根据相对演化散度标准化和分级,得到基因组分类数据库(GTDB),将目的序列和GTDB数据库比对,比对到的单拷贝蛋白序列进行alignment,而后进行发育树的绘制。


图片31