[發明專利]一種高密度遺傳圖譜的構建方法有效
| 申請號: | 201710804279.2 | 申請日: | 2017-09-08 |
| 公開(公告)號: | CN107644150B | 公開(公告)日: | 2021-03-19 |
| 發明(設計)人: | 蔡慶樂;唐耀華;何榮軍 | 申請(專利權)人: | 杭州和壹基因科技有限公司 |
| 主分類號: | G16B40/00 | 分類號: | G16B40/00;G16B20/20 |
| 代理公司: | 杭州中成專利事務所有限公司 33212 | 代理人: | 唐銀益 |
| 地址: | 310051 浙江省杭州市濱*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 高密度 遺傳 圖譜 構建 方法 | ||
1.一種高密度遺傳圖譜的構建方法,其特征在于,它包括以下步驟:
1)根據遺傳分離群體高通量測序數據中得到的SNP標記,對SNP標記進行基因型分型和過濾,再計算兩兩之間的重組率;
2)利用步驟1)算得的重組率,采用分層聚類算法根據前述遺傳分離群體的染色體數對SNP標記進行分組,得到與染色體數對應的連鎖群;
3)采用最小生成樹算法對SNP標記進行排序,對排序后的SNP標記采用最大期望算法進行補缺失,采用鄰近平均算法進行糾錯處理,然后采用k-opt算法對排序進行優化,最后計算遺傳距離得到遺傳圖譜;
所述采用鄰近平均算法進行糾錯處理的具體方法如下:
3.4.1)若第i個樣本第j個SNP標記基因型為A,則p(Ai,j)=1;若該標記基因型為B,則p(Ai,j)=0;所述的p(Ai,j)為基因型為A的可能性;
3.4.2)與第i個樣本第j個SNP標記鄰近標記的基因型為A的平均可能性由下式算得:
3.4.3)若E(Ai,j)-p(Ai,j)0.75,則認為該SNP標記是可疑的,重新記為缺失,反之則接受該標記。
2.根據權利要求1所述的高密度遺傳圖譜的構建方法,其特征在于,所述遺傳分離群體為性狀分離群體,包括FI、F2、RILd、BC1、DH、Hap中的一種或多種。
3.根據權利要求1所述的高密度遺傳圖譜的構建方法,其特征在于,所述步驟1)包括以下步驟:
1.1)根據親本的基因型及子代的基因型對SNP標記進行基因型分型;
1.2)使用卡方檢驗、缺失率對SNP標記進行過濾,得到高質量的SNP標記;
1.3)利用樣本基因型估計任意兩個SNP標記之間的重組率。
4.根據權利要求3所述的高密度遺傳圖譜的構建方法,其特征在于,所述步驟1.2)具體方法:
1.2.1)使用卡方檢驗過濾SNP標記的方法:
統計子代中每一種基因型的樣本個數,利用卡方檢驗判斷子代各基因型包含的樣本量是否符合孟德爾分離比,如果符合,則保留這一個SNP標記,如果不符合,則過濾該SNP標記;
1.2.2)基于缺失率過濾SNP標記的方法:
基于樣本缺失率:統計所有樣本中某一個SNP標記的缺失與否,如果缺失率小于設定的閾值,則保留該SNP標記,反之則過濾該SNP標記,缺失率=缺失樣本數/總樣本;
基于SNP標記缺失率:統計某一個樣本缺失的SNP標記總數,如果SNP標記缺失率小于設定的閾值,則保留該樣本,反之則過濾該樣本,缺失率=缺失的SNP標記數/總SNP標記數。
5.根據權利要求4所述的高密度遺傳圖譜的構建方法,其特征在于,步驟1.2.2)的缺失率設定的默認閾值為15%,SNP標記缺失率的默認閾值為30%。
6.根據權利要求3所述的高密度遺傳圖譜的構建方法,其特征在于,所述步驟1.3)具體步驟為:
1.3.1)以i代表第i個SNP標記,j代表第j個SNP標記,Ri,j表示兩個SNP標記發生重組的可能性;
1.3.2)如果兩個SNP標記靠的很近,沒有發生重組,那么Ri,j=0.0;
1.3.3)如果兩個SNP標記屬于不同的連鎖群,則Ri,j=0.5;兩個SNP標記靠的越近,發生重組的可能性越低,即兩個SNP標記連鎖的可能性越高;
1.3.4)統計樣本中兩個SNP標記重組的基因型樣本數量,重組率Ri,j=重組基因型樣本數量/樣本總數量;其中,重組基因型樣本表示子代基因型與親本基因型不同的樣本。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州和壹基因科技有限公司,未經杭州和壹基因科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710804279.2/1.html,轉載請聲明來源鉆瓜專利網。





