[發(fā)明專利]一種基于單倍型取樣預(yù)測(cè)大豆農(nóng)藝性狀表型的全基因選擇方法及其應(yīng)用在審
| 申請(qǐng)?zhí)枺?/td> | 201610349022.8 | 申請(qǐng)日: | 2016-05-24 |
| 公開(公告)號(hào): | CN107419000A | 公開(公告)日: | 2017-12-01 |
| 發(fā)明(設(shè)計(jì))人: | 邱麗娟;馬巖松;郭勇 | 申請(qǐng)(專利權(quán))人: | 中國(guó)農(nóng)業(yè)科學(xué)院作物科學(xué)研究所 |
| 主分類號(hào): | C12Q1/68 | 分類號(hào): | C12Q1/68 |
| 代理公司: | 北京紀(jì)凱知識(shí)產(chǎn)權(quán)代理有限公司11245 | 代理人: | 關(guān)暢,何葉喧 |
| 地址: | 100084 北*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 單倍型 取樣 預(yù)測(cè) 大豆 農(nóng)藝 性狀 表型 基因 選擇 方法 及其 應(yīng)用 | ||
1.一種建立預(yù)測(cè)大豆的農(nóng)藝性狀的模型的方法,包括如下步驟:用單倍型取樣原則代替全基因組SNP取樣原則,并根據(jù)單倍型取樣原則得到的SNP標(biāo)記群體建立預(yù)測(cè)大豆的農(nóng)藝性狀的模型。
2.如權(quán)利要求1所述的方法,其特征在于:所述農(nóng)藝性狀為株高、有效分枝數(shù)、單株莢數(shù)、單株粒重或百粒重。
3.如權(quán)利要求1或2所述的方法,其特征在于:所述“單倍型取樣原則”為:分析所有SNP標(biāo)記間的連鎖不平衡關(guān)系,將形成單倍型區(qū)間的SNP定義為“block-SNP”,將沒有處于任何一個(gè)單倍型區(qū)間的SNP定義為“blank-SNP”,在每個(gè)單倍型區(qū)間中隨機(jī)選擇一個(gè)SNP標(biāo)記作為該單倍型區(qū)間的代表,與全部blank-SNP標(biāo)記一起,構(gòu)成一個(gè)由m個(gè)SNP標(biāo)記組成的SNP標(biāo)記群體。
4.如權(quán)利要求1或2所述的方法,其特征在于:所述“單倍型取樣原則”的實(shí)現(xiàn)方式依次包括如下步驟:
①對(duì)所述訓(xùn)練群體中的各個(gè)大豆進(jìn)行全基因組掃描,獲得所有SNP標(biāo)記的基因型數(shù)據(jù);所述訓(xùn)練群體由n1個(gè)以上的大豆組成;n1為50以上的自然數(shù);
②分析所有SNP標(biāo)記間的連鎖不平衡關(guān)系,將形成單倍型區(qū)間的SNP定義為“block-SNP”,將沒有處于任何一個(gè)單倍型區(qū)間的SNP定義為“blank-SNP”,在每個(gè)單倍型區(qū)間中隨機(jī)選擇一個(gè)SNP標(biāo)記作為該單倍型區(qū)間的代表,與全部blank-SNP標(biāo)記一起,構(gòu)成一個(gè)由m個(gè)SNP標(biāo)記組成的SNP標(biāo)記群體。
5.權(quán)利要求1至4中任一所述方法在預(yù)測(cè)大豆的農(nóng)藝性狀中的應(yīng)用。
6.一種基于對(duì)訓(xùn)練群體建立模型從待測(cè)群體中篩選具有目標(biāo)農(nóng)藝性狀的大豆的方法,包括如下步驟:
(1)獲得訓(xùn)練群體中的各個(gè)大豆的農(nóng)藝性狀的無偏估計(jì)值;所述訓(xùn)練群體由n1個(gè)以上的大豆組成;n1為50以上的自然數(shù);
(2)對(duì)所述訓(xùn)練群體中的各個(gè)大豆進(jìn)行全基因組掃描,獲得所有SNP標(biāo)記的基因型數(shù)據(jù);分析所有SNP標(biāo)記間的連鎖不平衡關(guān)系,將形成單倍型區(qū)間的SNP定義為“block-SNP”,將沒有處于任何一個(gè)單倍型區(qū)間的SNP定義為“blank-SNP”,在每個(gè)單倍型區(qū)間中隨機(jī)選擇一個(gè)SNP標(biāo)記作為該單倍型區(qū)間的代表,與全部blank-SNP標(biāo)記一起,構(gòu)成一個(gè)由m個(gè)SNP標(biāo)記組成的SNP標(biāo)記群體;
(3)基于所述訓(xùn)練群體,對(duì)于農(nóng)藝性狀與基因型的關(guān)系建立如下方程式甲:Y=Y(jié)=μ1+X×g+ε1;Y為n1維向量,代表訓(xùn)練群體中的各個(gè)大豆的所述農(nóng)藝性狀的無偏估計(jì)值;μ1代表組成訓(xùn)練群體的各個(gè)大豆的所述農(nóng)藝性狀的無偏估計(jì)值的平均值;X為n1×m維矩陣,代表SNP基因型代碼,由-1,0,+1組成,其中±1代表純和基因型,0代表雜合基因型;g為m維向量,表示SNP的效應(yīng)值;ε1代表殘差;將步驟(1)中的相應(yīng)數(shù)據(jù)和所述SNP標(biāo)記群體中的各個(gè)SNP標(biāo)記的基因型數(shù)據(jù)轉(zhuǎn)化為基因型代碼輸入上述方程式甲,得到對(duì)于所述農(nóng)藝性狀來說各個(gè)SNP的g值;
(4)基于步驟(3)得到的g值,通過隨機(jī)回歸最佳線性無偏預(yù)測(cè)模型,得到驗(yàn)證群體中的各個(gè)大豆的所述農(nóng)藝性狀的預(yù)測(cè)值,從而從驗(yàn)證群體中篩選所述農(nóng)藝性狀滿足預(yù)期標(biāo)準(zhǔn)的大豆;所述驗(yàn)證群體由n2個(gè)以上的大豆組成;n2為5以上的自然數(shù)。
7.如權(quán)利要求6所述的方法,其特征在于:所述農(nóng)藝性狀為株高、有效分枝數(shù)、單株莢數(shù)、單株粒重或百粒重。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國(guó)農(nóng)業(yè)科學(xué)院作物科學(xué)研究所,未經(jīng)中國(guó)農(nóng)業(yè)科學(xué)院作物科學(xué)研究所許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610349022.8/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法、程序以及記錄介質(zhì)
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 基于時(shí)間序列預(yù)測(cè)模型適用性量化的預(yù)測(cè)模型選擇方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 分類預(yù)測(cè)方法及裝置、預(yù)測(cè)模型訓(xùn)練方法及裝置
- 幀內(nèi)預(yù)測(cè)的方法及裝置
- 圖像預(yù)測(cè)方法及裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 文本預(yù)測(cè)方法、裝置以及電子設(shè)備
- 模型融合方法、預(yù)測(cè)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





