解锁陆地棉基因组图谱,揭示异源四倍体演化奥秘
我们于 2015 年在《Nature Biotechnology》发表的研究,首次组装了高质量的陆地棉(TM-1)参考基因组,为棉花纤维改良和抗性育种提供了核心遗传资源。
由中国农业科学院棉花研究所、华大基因、北京大学等机构合作完成的论文 “Genome sequence of cultivated Upland cotton (Gossypium hirsutum TM-1) provides insights into genome evolution” 已在 Nature Biotechnology 发表,刘心作为参与作者。
研究背景
陆地棉(Upland cotton)提供了全球 90% 以上的天然棉纤维。然而,由于它是一个复杂的异源四倍体(由 A 基因组和 D 基因组供体融合而成),且含有大量重复序列,其基因组组装一直是学界公认的“硬骨头”。解析这一基因组对于提升棉花产量、纤维长度及抗逆性至关重要。
核心突破
-
攻克四倍体组装难题 研究团队采用“181倍深度测序 + 5倍 BAC-to-BAC 序列辅助 + 高分辨率遗传图谱”的综合策略,成功组装了约 2.17 Gb 的陆地棉基因组,鉴定了 70,478 个蛋白编码基因。这是当时最完整的四倍体棉花基因组。
-
揭示亚基因组的协同演化 研究发现,在陆地棉形成后的 100-200 万年间,其两个亚基因组(At 和 Dt)表现出显著的表达优势切换。令人惊讶的是,尽管 D 基因组供体本身并不生产长纤维,但在陆地棉中,来源于 D 亚基因组的基因却对纤维发育起到了关键调控作用。
-
纤维发育的分子机制 通过比较分析,研究识别了大量与纤维延伸(Cell elongation)和木质素合成相关的基因。发现陆地棉中乙烯平衡(Ethylene homeostasis)的精细调控是驱动纤维超长生长的核心机制之一。
-
转座子与基因组扩张 研究证实,陆地棉基因组规模的扩张主要源于转座子(TEs)的爆发,这些转座子的活动也重塑了棉花的调控网络。
研究意义
陆地棉基因组的发布为棉花育种家开启了“全书视角”。它极大地加速了棉花纤维品质和抗旱、抗病相关基因的定位,为通过基因工程培育高产、优质的“超级棉花”奠定了坚实的科学基础。
协作与致谢
本研究是一个深度协作的成果,参与单位包括中农科院棉研所喻树迅院士团队、华大基因(BGI)、北京大学朱玉贤院士团队等。