SommerGS

制作:张敖、陈珊、阮燕晔 https://datahold.cn

鸣谢

张学才,CIMMYT,指导

候智馨,沈阳农业大学,测试

公开测试

该版本公开测试,可能有很多BUG,如有问题请联系作者。

最新更新

【2023-11-03 11:00:29】

  1. 修正了有时avgGRM无法计算预测精度的问题。

【2023-03-03 15:53:29】

  1. 公开测试1.0版本。

  2. 整合新版本的GBIT。

【2021-09-07 22:24:40】

  1. 修正了不适用CDmean出错的BUG。

【2021-07-13 16:23:55】

  1. 修正了CDmean的群体大小修改无效的BUG。

  2. 修正了有时rrBLUP方法输出文件错误的BUG。

【2021-07-11 22:21:58】

  1. 修正了avgGRM的路径问题。

  2. 增加了预测群体名到avgGRM和CDmean方法的预测精度文件名。

【2021-07-11 12:48:06】

  1. 增加了利用已经分析好的基因型和表型中间文件跳过前面若干步骤,大幅提高计算效率。

  2. 增加CDmean和avgGRM的预测精度。

【2021-07-08 18:03:20】

  1. 增加CDmean方法的群体优化。

  2. 增加avgGRM方法的群体优化。

【2021-07-04 11:24:03】

  1. 修正BUG。

【2021-06-29 22:33:45】

  1. 完成功能。

  2. 当sommer包的rrBLUP无法使用时,可以选择使用rrBLUP包的rrBLUP建模算法。

功能

  1. HMP数值化。

  2. 利用sommer包的GBLUP和rrBLUP方法计算全基因组预测值。

  3. 将环境效应作为固定效应,做GS。

  4. 自定义k倍交叉验证的k值。

  5. 整合了rrBLUP包,可以使用rrBLUP包做预测。

  6. 使用CDmean和avgGRM方法优化建模群体。

使用方法

普通预测

  1. 准备基因型文件,HMP格式,推荐先使用TASSEL进行表型和基因型的筛选。

  2. 准备表型文件,可以直接使用CIMMYT开发的META-R软件的跨环境结果作为表型文件。

  3. 多个群体组合在一起可以增加group列,用于区分每个群体分组,做群体间预测。

  4. 结果会生成在【GBIT/NoGbyE】目录下。

群体A预测群体B

  1. 设置如下内容。

  2. 其他设置同普通预测。

基因型与环境互作预测

环境效应作为固定效应

  1. 该预测假设,每个环境须有相同的方差。

  2. 表型文件使用META-R软件对个体计算BLUP、BLUE的结果,或类似格式。

  3. 若要使用不同群体进行预测,首先要保证每个群体都有相同的地点。

  4. 结果会生成在【GBIT/GbyE】目录下。

  5. 每个循环的预测结果在【GbyE_GEBV.csv】中,可以手动计算相关性(预测精度)。

  6. 其他设置同普通预测。

环境效应方差不同(完善中)

  1. 该预测假设,每个环境的方差不同,在每个环境拟合方差组分。缺点是环境间没有协方差。

  2. 表型文件使用META-R软件对个体计算BLUP、BLUE的结果,或类似格式。

  3. 结果会生成在【GBIT/GbyE】目录下。

  4. 每个循环的预测结果在【GbyE_GEBV.csv】中,可以手动,见

  5. 其他设置同普通预测。

CDmean建模群体优化

  1. 设置如下内容。

  2. 如果有错误信息,请忽略,直接查看【GBLUP_方法_群体大小.cor.csv】和【rrBLUPr_方法_群体大小.cor.csv】文件中的相关系数,出错时,通常GBLUP的结果为NA,所有预测结果均为0,原因不明,推测是由于sommer包使用的直接反演算法,有局限性。此时可参考rrBLUP的结果,两者实际预测结果非常接近。

avgGRM建模群体优化

  1. 设置如下内容。train_pop里不能包含test_pop。

  2. 运行后会获得【optimization\avgGRM_DTMA.csv】文件,_DTMA表示测试群体为DTMA。

  3. 再次运行,不会重复生成该文件,直接读取。

  4. 如果有错误信息,请忽略,直接查看【GBLUP_方法_群体大小.cor.csv】和【rrBLUPr_方法_群体大小.cor.csv】文件中的相关系数,出错时,通常GBLUP的结果为NA,所有预测结果均为0,原因不明,推测是由于sommer包使用的直接反演算法,有局限性。此时可参考rrBLUP的结果,两者实际预测结果非常接近。

计算相关性

  1. 打开【GbyE_GEBV.csv】文件,全选并复制。

  2. 运行下面代码。

  3. 运行完成会生成【GbyE_BLUE.csv】,另存为【GbyE_BLUP.xlsx】。

  4. 将BLUP或BLUE数据拷贝到该数据旁,最好空几行。

  5. 按照材料名称完全对应,可使用排序功能,多余材料删除。

  6. 利用函数=CORREL(B1:B282,DC1:DC282)计算相关性。

代码

  1. 运行代码前,请按照说明调整参数,否则会出错。

  2. 将下面代码复制到RStudio中,修改参数。

  3. WD设置后,会生成【GBIT】和【optimization】。

  4. 全选运行。

国内: