人类真菌病原体的染色体水平基因组组装揭示了地理上不同物种之间的共线性
荚膜组织胞浆菌是一种二型真菌病原体,是免疫活性宿主真菌性呼吸道感染的最常见原因。组织胞浆是美国俄亥俄州和密西西比河流域的地方性疾病,在全世界也有分布。以前的研究已经揭示了至少八个分支,每个分支都特定于一个地理位置:北美1和2级(NAm 1和NAm 2)、拉丁美洲a和B组(LAm a和LAm B)、欧亚大陆、荷兰、澳大利亚和非洲,以及另外一个由巴拿马分离物组成的独特谱系(H81)。以前组装的组织胞浆基因组高度碎片化,具有高度重复性的G217B(nam2)菌株,被用于大多数全基因组规模的转录组研究,被组装成超过250个contigs。在这项研究中,我们着手于完整地组装重复区域并描述大规模基因组结构组织胞浆物种。我们重新排序组织胞浆使用牛津纳米孔技术长读测序技术的菌株(WU24[NAm 1]、G217B[NAm 2]、H88[非洲]、G186AR[巴拿马]和G184AR[巴拿马])。在这里,我们报告了所有五个菌株的染色体水平组合,它们在地理上遥远的地方表现出广泛的同源性组织胞浆孤立。新的集会显示RYp2型G186AR是一个重要的形态和毒力调节因子。此外,我们将先前生成的转录组数据集映射到新组装的染色体上。我们的分析表明,在G217B和H88菌株中,转座子和转座子嵌入基因在酵母期的表达比菌丝期上调。这项研究为真菌研究人员提供了一个重要的资源,并进一步强调了染色体水平组装在分析高通量数据集中的重要性。
重要性 组织胞浆物种是一种二型真菌,在全世界范围内造成了显著的发病率和死亡率。这些真菌在土壤中以霉菌的形式生长,在人类宿主中作为萌芽酵母生长。组织胞浆可以从不同地区的土壤中分离出来,包括北美、南美、非洲和欧洲。系统发育不同的物种组织胞浆已经被分离和测序。然而,对于常用的菌株,基因组组装已经支离破碎,导致基因组规模的数据利用不足。本研究提供了染色体水平上常用的装配体组织胞浆使用长读测序技术的菌株。对这些基因组的比较分析表明,染色体中的基因序列基本上是保守的。绘制这些新组合的现有转录组数据揭示了转录共调控基因的聚集。这项研究的结果强调了获得染色体水平的装配体对于理解人类真菌病原体生物学的重要性。