贝博app体育官方下载

贝博app体育官方下载:Nature Genetics 无完整基因组识别植物表型变异的遗传变异方法

发布时间:2022-08-31 14:36:48 来源:贝博app最新下载地址 作者:贝博ballbet网页版登录

  结构变异的多态性(存在/缺失)在植物基因组中很常见,但它们在全基因组关联研究(GWAS)中经常被忽视。本文扩展了GWAS中检测到的遗传变异类型,包括重大缺失、插入和重排。

  研究首先使用原始测序数据直接推导出短序列,即k-mers,它独立于参考基因组的广泛多态性。然后将与表型相关的k-mers与特定的基因组区域联系起来。使用这种方法,我们重新分析了拟南芥、番茄和玉米种群的2000个性状。k-mers相关的结论与SNP相关的结论相同,但具有更强的统计支持。重要的是,该研究发现了与结构变异和参考基因组中缺失区域的新关联。

  为了初步验证这一概念,本文研究了拟南芥的一个模式性状(开花时间)。研究者使用现有的数据集定义了1000份近交系材料中31-bp k-mers的存在/缺失模式。在总共22.6亿个独特的k-mers中,4.39亿个出现在至少5个种质中。把k-mer的存在/缺失作为两种等位基因对比,使用线性混合模型(LMM)进行全基因组关联分析,以解释种群结构,并将其与SNP和短指数分析进行比较。

  为了证明该方法对更大、更复杂的基因组的有效性,研究者进而分析了玉米。将该方法应用于150个短读序列覆盖至少6×的自交系的252个主要形态性状。在至少5个品种中总共存在23亿个k-mers。通过至少一种方法确定了89个性状的显著关联,并通过两种方法确定了37个性状的显著关联。在拟南芥中也一样,两种方法的top特征具备显著差异性。k-mers的top特征P值低于SNP的top特征,并且k-mers方法检测到SNP未发现的关联。

  番茄的基因组约为900Mb,比玉米的基因组要小,从野生亲缘到驯化番茄有一个复杂的渗入历史,因此也具备自身挑战。从246份材料中的9.81亿k-mers开始,研究者对96个代谢物测量进行了全基因组关联分析。对于许多代谢物,两种方法都确定了相关性,但其中3种只有SNP分析出, 13种只有k-mers分析出。与其它物种类似,两种方法所识别的变异和top P值也存在相关性。k-mers方法的top特征关联强于SNP的top特征,甚至比在拟南芥或玉米中看到的更为强烈。

  结论:研究结果证明了k-mers结合GWAS的能力,可以检测出与表型变异相关的、更广泛的遗传变异。

上一篇:知识产权基本常识与综合服务篇 下一篇:iOS 15:如何在照片中使用视觉查找来识别地标、植物和宠物