[發明專利]基于生物信息的選育良種系統及其算法在審
| 申請號: | 201611022901.6 | 申請日: | 2016-11-18 |
| 公開(公告)號: | CN106779076A | 公開(公告)日: | 2017-05-31 |
| 發明(設計)人: | 欒圖 | 申請(專利權)人: | 欒圖;尹聰;梅森 |
| 主分類號: | G06N3/12 | 分類號: | G06N3/12;G06F19/10 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 201204 上海市浦東*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 生物 信息 選育 良種 系統 及其 算法 | ||
1.一種基于生物信息的選育良種系統,其特征在于,具體實施步驟如下:
一、采用全基因組選擇方法,首先獲取參考群體和候選群體個體的基因組數據,其中,采用SNP遺傳標記來獲取基因型數據;
二、獲取系譜文件并進行預處理,向上追溯父母系譜信息至少5代及以上,系譜文件需要包含個體編號、父親編號和母親編號至少三段信息,在系譜文件中篩選具有基因型數據的基因分型個體,向上追溯父母系譜信息至少5代及以上以獲得GA系譜;通過基因分型個體的基因型數據信息對系譜文件中父母及后代親緣關系進行親子鑒定以核查GA系譜文件,當根據基因型數據獲得的親子鑒定結果與原始GA系譜文件所顯示的親子關系不一致時,應以基因型數據獲得的親子鑒定結果為基準重新編排原始GA系譜文件;
三、在完成基因型數據的預處理并得到了GA系譜文件后,通過LDMIP方法來完成,具體的LDMIP方法,如下:
A、GA系譜中未基因分型的祖先個體,推知其基因型數據;
B、根據基因型數據和GA系譜信息,計算個體等位基因從父母處遺傳的遺傳幾率;
C、通過LDMIP程序的計算結果可以建立起GA系譜中參考群體和候選群體之間的LDLA關系矩陣,這一關系矩陣既包括參考群體和候選群體之間基于基因型信息的個體親緣關系,又包括參考群體和候選群體之間基于系譜信息的血緣關系,得到LDLA關系矩陣之后,對其求逆,然后通過混合模型方程組求解候選群體個體的全基因組育種值;
D、同時利用個體等位基因從父母處遺傳的遺傳幾率計算可以示蹤等位基因在系譜中世代傳遞信息,如可以用于檢測和確定與疾病相關的功能基因,有助于選育抗病能力強的個體。
2.根據權利要求1所述的一種基于生物信息的選育良種系統,其特征在于,采用SNP遺傳標記來獲取基因型數據具體方式如下:通過SNP芯片獲取參考群體和候選群體的基因型數據并進行預處理,首先基因分型個體的基因型數據如有缺失,對所缺失的基因型予以填充;然后通過SNP標記檢出率、最小等位基因頻率、Hardy-Weinberg平衡檢驗、個體檢出率等參數優化數據質量。
3.權利要求1所述的一種基于生物信息的選育良種系統的算法,其特征在于,對于基因型數據的每個SNP位點的兩個等位基因用0、1進行編碼從而得到每個個體的每個SNP位點基因型編碼,其中,如第i個個體的第j個SNP位點的編碼gij,則對于純合子“00”的基因型編碼為“0”;對于純合子“11”編碼為“2”;對于雜合子“10”或“01”編碼為“1”;然后通過LDMIP程序根據GA系譜首先預測祖先個體基因型編碼信息,然后計算每個基因座位的等位基因從父母處遺傳的遺傳幾率,利用等位基因遺傳幾率可以得到連鎖分析信息,通過LDMIP程序還可以同時得到連鎖不平衡信息,與連鎖分析信息共同組建GLDLA關系矩陣,其中,GLDLA關系矩陣的行數和列數相同,均為GA系譜中個體的數目。
4.根據權利要求3所述的一種基于生物信息的選育良種系統的算法,其特征在于,構建GLDLA關系矩陣要涉及到構建基于系譜信息的血緣關系矩陣-A矩陣,和基于SNP信息的親緣關系矩陣-G矩陣,構建A矩陣的元素依據以下規則來遞推確定,即對于系譜中一個體i和它的父親s和母親d,其與系譜中另一個體j的關系為:
一、如果它的父親和母親都已知,則
aij=aji=0.5(ajs+ajd)
aii=1+0.5(asd);
二、如果它的父親s已知,母親d未知,則
aij=aji=0.5(ajs)
aii=1;
三、如果它的母親d已知,父親s未知,則
aij=aji=0.5(ajd)
aii=1;
四、如果它的父親和母親都未知,則
aij=aji=0
aii=1;
G矩陣的構建依據如下方法:
其中Nm為SNP位點數目,對于個體i和個體j,X中的元素Xij由以下方法確定:
其中gij為前述第i個個體的第j個SNP位點的基因型編碼,pj為第j個SNP位點的第一個等位基因的基因頻率,通過基因型數據樣本計算得出;
在A矩陣和G矩陣都構建好之后,利用如下方法構建GLDLA關系矩陣:
GLDLA=D*A*D+Δ*G*Δ;
而D和Δ分別是兩個對角矩陣,其中D矩陣的對角元;
Δ矩陣的對角元
通過GLDLA關系矩陣,對其求逆,利用逆矩陣以及參考群體個體的表型數據可以建立如下混合模型方程組,
其中λ=σe2/σa2,通過迭代求解混合模型方程組即可預測候選群體個體的全基因組育種值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于欒圖;尹聰;梅森,未經欒圖;尹聰;梅森許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611022901.6/1.html,轉載請聲明來源鉆瓜專利網。
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





