棉花基因组数据集

数据集总体介绍

棉属包括几种不同的棉种。它是一种重要的农艺纤维作物,是热带和温带地区的重要油料作物。棉花种子产生毛状体,是特化的种子毛,是最长的植物细胞之一。除了它的经济价值外,棉花在生物学研究中也具有重要作用,研究者利用棉花建立了一个有趣的系统,来研究与细胞分化、细胞膨胀和细胞壁变化有关的基本细胞过程。栽培种棉花的染色体倍性分布在二倍体(2n=26)和异源四倍体(2n = 4x = 52) 之间。异源四倍体物种陆地棉(G. hirsutum L.)是世界上最重要的纤维作物和模式多倍体作物。棉属包括46个二倍体和5个四倍体棉种,所有的二倍体棉种均来自同一祖先,经演化形成了A、B、C、D、E、F、G和K基因组,四倍体棉种的基因组类型为AD。目前认为AD基因组是由A基因组祖先与D基因组祖先杂交后染色体加倍而形成的,其中就包括陆地棉。高质量组装异源多倍体植物基因组是一个艰难的任务,因为这种基因组比较大,包含大量的重复序列和高度同源的亚基因组。2007年12月,棉花所联合国内外优势科研单位,率先在国际上牵头启动了棉花基因组计划。2012年8月,雷蒙德氏棉(D基因组)全基因组图谱绘制完成。2014年4月,亚洲棉(A基因组)全基因组测序完成工作。在上述工作的基础上,2015年4月,完成了四倍体棉花-陆地棉(AD组)基因组的测序、组装及分析工作。

数据列表

棉花-华大基因 PRJNA320881 PRJNA259930