科研进展| 基因组所联合多家单位成功破解铁观音基因组与茶树演化史
茶树是重要的经济作物,起源于中国并在世界范围内产生重要影响。令人愉悦的香味和沉淀千年的文化使茶成为除水之外最受大众喜爱的健康饮品。近年来随着测序技术的发展,多个茶树全基因组物理图谱被破译[1-8],但仍然缺乏对乌龙茶之首铁观音基因组的研究。
由福建农林大学尤民生教授和中国农业科学院(深圳)农业基因组研究所(简称“深圳基因组所”)张兴坦研究员主持,联合国内外多家单位的科学家共同合作成功破解铁观音基因组和茶树演化史,研究成果于2021年7月15日以“Haplotype-resolved genome assembly provides insights into evolutionary history of the tea plant Camellia sinensis”为题发表在国际顶级期刊《自然遗传学》(Nature Genetics)上。研究人员利用独立开发的新算法攻克高杂合、高重复铁观音基因组组装难题,并在此基础上阐述了等位基因不平衡、茶树群体演化和驯化等相关科学问题。
成功破解铁观音单倍体分型组装技术难题
铁观音原产于福建省泉州市安溪县西平镇,相传于清朝雍正年间被当地茶农发现,因其叶形似观音脸重如铁而被乾隆赐名为“铁观音”。茶树是自交不亲和植物,更因长期的无性繁殖积累大量体细胞突变,导致基因组高度杂合、组装难度很大。研究团队利用自主开发的两种算法(Khaper和ALLHiC)整合Illumina短读长、pacBio CLR长读长和高通量三维染色质捕获技术(Hi-C),攻克高杂合基因组组装难题,成功拼接了两套铁观音基因组(图1):单倍体参考基因组(monoploid reference genome)和单倍体分型基因组(haplotype-resolved genome)。茶树是二倍体,含有15对同源染色体(2n=2x=30),单倍体参考基因组是筛选同源染色体中的一份拷贝作为代表组装到染色体水平,而单倍体分型基因组是将来源于不同父母本的两套同源染色体同时组装到染色体水平。前者不区分等位基因,广泛用于二倍体基因组的组装;后者区分等位变异,更完整地呈现二倍体基因组的全部遗传信息。
图1. 铁观音基因组组装和质量评估
(a)单倍体参考基因组circos图,呈现15染色体特征;(b)Hi-C热图呈现15条染色体组装质量;(c)LAI评估铁观音和已发表其他茶树基因组组装质量;(d)铁观音单倍体参考基因组和分型基因组的共线性比较。
利用等位优势基因应对“遗传负荷”
铁观音距今已有约300年的栽培历史,长期的无性繁殖积累大量体细胞突变(包括有害突变),增加了遗传负荷(genetic load),导致其适应性降低。然而人们对无性繁殖作物如何应对遗传负荷这一问题知之甚少。传统的杂种优势现象可以由显性效应和超显性效应两种假说解释:显性效应指个体倾向于利用有利于生长和发育的优势等位基因(或显性基因)而忽略对个体不利的劣势基因(或隐形基因);超显性效应指杂合等位组合在多种生境下优于任一纯合等位的现象。研究人员基于铁观音分型基因组组装,鉴定到14691个基因具有等位变异。RNA-seq分析显示,其中1528个基因存在一致性的等位特异性表达(consistent allele-specific expression, consistent ASE),即其中一个等位基因在所有组织和样本中的表达都高于另一等位基因;而只有386个基因存在非一致性的等位特异表达(inconsistent ASE),即两个等位基因分别在不同的组织中存在特异高表达。前者可以被认为是具有显性效应的基因,而后者是具有超显性效应的基因。这一结果显示,在无性繁殖的茶树基因组中,显性效应可能是其应对遗传负荷的重要机制。面对大量积累的体细胞突变或有害突变,个体选择使用未突变或对个体有利的等位基因维持其正常的生长发育和对环境的适应性。
大叶茶与小叶茶存在不同的演化和驯化历史
茶树遗传多样性较高。研究人员对161个茶树品种和15个近缘种大理茶进行重测序分析发现,这些个体聚类为三组,分别为大理茶(CT)、大叶茶(CSA)和小叶茶(CSS)。其中大叶茶分为两个亚组,古大叶茶(ACSA)和栽培大叶茶(CCSA);而小叶茶分为四个亚组,依据其主要地理分布可以划分为川陕赣(SSJ)、浙江和闽北(ZJNFJ)、闽南(SFJ)、两湖(湖南和湖北)和安徽(HHA)。遗传分析显示各茶区存在频繁的种质基因交流,其中一些与有记录的茶树杂交育种历史相吻合(图2)。比如茶树黄玫瑰品种呈现出铁观音与黄棪基因组混合的组分,而黄玫瑰是两者子代黄观音和黄棪回交选育的优良品种。这种频繁的基因交流不仅出现在茶树种内,在茶树与近缘种间也普遍存在。研究人员通过对8个茶树品种和山茶属茶组的12个近缘物种系统发育分析发现,这些物种呈现网状演化模式,而非简单的树形演化。更多的证据表明,茶树与近缘种间频繁的杂交渐渗(introgression)是其网状演化和维持茶树遗传多样性的重要因素。
图2.茶树的系统发育关系和群体结构
(a)重测序个体的地理分布;(b)系统发育树;(c)重测序群体的主成分分析(pCA);(d)K=7模型下的群体遗传结构图,下方显示了两个有记录的现代繁殖事件。
栽培茶树品种主要分为大叶茶(C. sinensis var.assamica,CSA)和小叶茶(C. sinensis var.sinensis, CSS),两者之间在形态上具有明显差异。前者植株较高、叶片较大、多为乔木,主要生长在云南、广东等温度较高的地域;而后者植株较矮、叶片较小、多为小乔木或灌木,可以生长在北至山东等较寒冷地区。研究人员通过群体遗传分析发现大叶茶和小叶茶具有不同的演化和驯化历史。在距离约259-181万年的格拉斯阶时期,剧烈的气候变化很可能导致了整个茶树物种的群体收缩,这也是一次大叶茶和小叶茶共享的瓶颈事件。两个变种分化后,小叶茶的生境遭遇了末次冰盛期,2.65-1.9万年前的温度骤降可能使得小叶茶出现了再一次的群体瓶颈,但随后适应了环境的小叶茶迅速扩张,群体规模得到恢复(图3)。
图3. 茶树的群体动态历史
(a)小叶种(上)和大叶种(下)历史有效群体大小;(b)过去42万年的历史温度变化。
此外,人们对大叶茶和小叶茶制品的偏爱有所不同也导致了两者经历了平行的驯化历程(图4)。大叶茶早期的驯化主要筛选了一些糖苷类物质转运的相关基因,而在品种改良阶段人们更关注生物碱和香气挥发物相关的代谢途径。例如,研究人员鉴定到CsXDH基因在大叶茶品种改良阶段受到强烈的人工选择,该基因编码黄嘌呤脱氢酶,是咖啡因合成通路的重要基因[9]。小叶茶早期人工选择的基因与植物防御和抗性相关,事实上这些受选择的基因同时也参与到了重要的次级代谢产物的生物合成,例如R-柠檬烯、β罗勒烯等途径。作为儿茶素合成通路的关键基因,F3’H也在这一过程中受到人工选择。而在小叶茶品种改良过程中,人工驯化涉及到花发育和一氧化氮(NO)响应相关的基因。之前的研究表明,NO的积累可以加速γ-氨基丁酸的消耗从而帮助植物抵御冷胁迫[10],这一结果暗示着筛选耐寒的品种也是人工选育的重要目标。
茶树的“绿色革命”基因
20世纪60年代,大规模推广矮秆或半矮秆的水稻和小麦品种极大的提高了作物产量,解决了发展中国家急剧增长的粮食需求,控制水稻株高的sd1基因和小麦的rht基因也因其巨大的贡献被称为“绿色革命基因”[11]。研究人员发现,茶树的株高在长期的栽培过程中也受到驯化,体现在两个细胞色素p450家族基因受到人工选择(CsBAS1和CsDWF4)。这两个基因参与油菜素内酯合成,前者的拟南芥突变体导致了延长的下胚轴,而后者的突变直接导致了植株侏儒的表型[12-13]。
图4. 大叶茶(CSA)和小叶茶(CSS)人工选择的特征与平行驯化的证据
(a)CSA与CSS平行驯化路线图;(b)基于Xp-EHH识别的选择性清除信号在全基因组的分布;(c)XDH基因中人工选择的信号;(d)CM(脉络膜类诱变酶)基因中的人工选择信号;
(e)F3’H基因中人工选择的信号;(f)与植物高度相关的BAS1和DWF4基因的人工选择信号;(g)人工选择基因的表达,包括根(RT)、茎(ST)、花(FL)、芽(BD)、幼叶(YL)、老叶(OL)。
该项目在攻克铁观音基因组的基础上,通过对茶树种群水平的遗传分析,揭示了该物种的演化和人工驯化历史。该成果为利用组学分析和分子生物学技术挖掘功能基因、解析其背后的遗传调控机制,开展基于大数据驱动的基因组智能设计育种奠定了坚实的理论基础,同时也为缩短育种周期、提高育种效率、降低育种成本提供了科学依据。
该项目由福建农林大学、深圳基因组所等国内外多家单位合作完成。深圳基因组所张兴坦研究员、福建农林大学硕士研究生陈帅、福建省农科院水稻所施龙清博士、中国农科院烟草研究所龚达平研究员为论文共同第一作者,福建农林大学尤民生教授、唐海宝教授和深圳基因组所张兴坦研究员为共同通讯作者。
论文链接:https://www.nature.com/articles/s41588-021-00895-y