解锁陆地棉基因组图谱,揭示异源四倍体演化奥秘

解锁陆地棉基因组图谱,揭示异源四倍体演化奥秘

我们于 2015 年在《Nature Biotechnology》发表的研究,首次组装了高质量的陆地棉(TM-1)参考基因组,为棉花纤维改良和抗性育种提供了核心遗传资源。


由中国农业科学院棉花研究所、华大基因、北京大学等机构合作完成的论文 “Genome sequence of cultivated Upland cotton (Gossypium hirsutum TM-1) provides insights into genome evolution” 已在 Nature Biotechnology 发表,刘心作为参与作者。

研究背景

陆地棉(Upland cotton)提供了全球 90% 以上的天然棉纤维。然而,由于它是一个复杂的异源四倍体(由 A 基因组和 D 基因组供体融合而成),且含有大量重复序列,其基因组组装一直是学界公认的“硬骨头”。解析这一基因组对于提升棉花产量、纤维长度及抗逆性至关重要。

核心突破

  1. 攻克四倍体组装难题 研究团队采用“181倍深度测序 + 5倍 BAC-to-BAC 序列辅助 + 高分辨率遗传图谱”的综合策略,成功组装了约 2.17 Gb 的陆地棉基因组,鉴定了 70,478 个蛋白编码基因。这是当时最完整的四倍体棉花基因组。

  2. 揭示亚基因组的协同演化 研究发现,在陆地棉形成后的 100-200 万年间,其两个亚基因组(At 和 Dt)表现出显著的表达优势切换。令人惊讶的是,尽管 D 基因组供体本身并不生产长纤维,但在陆地棉中,来源于 D 亚基因组的基因却对纤维发育起到了关键调控作用。

  3. 纤维发育的分子机制 通过比较分析,研究识别了大量与纤维延伸(Cell elongation)和木质素合成相关的基因。发现陆地棉中乙烯平衡(Ethylene homeostasis)的精细调控是驱动纤维超长生长的核心机制之一。

  4. 转座子与基因组扩张 研究证实,陆地棉基因组规模的扩张主要源于转座子(TEs)的爆发,这些转座子的活动也重塑了棉花的调控网络。

研究意义

陆地棉基因组的发布为棉花育种家开启了“全书视角”。它极大地加速了棉花纤维品质和抗旱、抗病相关基因的定位,为通过基因工程培育高产、优质的“超级棉花”奠定了坚实的科学基础。

协作与致谢

本研究是一个深度协作的成果,参与单位包括中农科院棉研所喻树迅院士团队、华大基因(BGI)、北京大学朱玉贤院士团队等。

阅读论文全文:https://doi.org/10.1038/nbt.3208