[發明專利]一種高密度遺傳圖譜的構建方法有效
| 申請號: | 201710804279.2 | 申請日: | 2017-09-08 |
| 公開(公告)號: | CN107644150B | 公開(公告)日: | 2021-03-19 |
| 發明(設計)人: | 蔡慶樂;唐耀華;何榮軍 | 申請(專利權)人: | 杭州和壹基因科技有限公司 |
| 主分類號: | G16B40/00 | 分類號: | G16B40/00;G16B20/20 |
| 代理公司: | 杭州中成專利事務所有限公司 33212 | 代理人: | 唐銀益 |
| 地址: | 310051 浙江省杭州市濱*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 高密度 遺傳 圖譜 構建 方法 | ||
本發明提供了一種高密度遺傳圖譜的構建方法,步驟是1)根據遺傳分離群體高通量測序數據中得到的SNP標記,對標記進行基因型分型和過濾,再計算兩兩之間的重組率;2)利用步驟1)算得的重組率,采用分層聚類算法根據前述遺傳分離群體的染色體數對SNP標記進行分組,得到與染色體數對應的連鎖群;3)采用最小生成樹算法對標記進行排序,對排序后的SNP標記進行補缺失和糾錯處理,最后計算遺傳距離得到遺傳圖譜。本發明針對不同的遺傳分離群體高效、高準確率的構建遺傳圖譜,為后續的生物信息學分析和遺傳學研究提供有力支持。
技術領域
本發明屬于生物信息技術領域,更具體的說,它涉及一種高密度遺傳圖譜的構建方法。
背景技術
遺傳圖譜是指某一物種的染色體圖譜,也稱為連鎖圖譜,用于表示基因和/或遺傳標記的相對位置。遺傳標記種類繁多,隨著生物信息學和測序技術的進步,單核苷酸的多態性(SNP)標記由于其數量大、多態性豐富而越來越受到大家的重視,這使得構建高密度遺傳圖譜成為可能,但同時帶來了對圖譜構建方法和分析效率的挑戰。
目前針對F1群體(親本雜交產生的子一代)的分析軟件很少,常見的就JoinMap4.0、Onemap、GACD等,雖然可以分析,但效率均很低,且分析的遺傳標記數量有限。針對這種現象,有必要開發一種高效、高準確率,可適用不同物種不同分離群體的高密度遺傳圖譜的構建方法。
發明內容
本發明的目的是解決以上提出的問題,提供一種基于遺傳標記的高密度遺傳圖譜的構建方法,命名為SMRTmap。以高通量測序產生的SNP數據為基礎,針對不同的遺傳分離群體進行基因分型,得到高質量的SNP標記,進而利用SMRTmap構建高密度遺傳圖譜。本發明的方法可以針對不同的遺傳分離群體高效、高準確率的構建遺傳圖譜,為后續的生物信息學分析和遺傳學研究提供有力支持。
本發明是通過以下技術方案實現的:
本發明公開了一種高密度遺傳圖譜的構建方法,它包括以下步驟:
1)根據遺傳分離群體高通量測序數據中得到的SNP標記,對標記進行基因型分型和過濾,再計算兩兩之間的重組率;
2)利用步驟1)算得的重組率,采用分層聚類算法根據前述遺傳分離群體的染色體數對SNP標記進行分組,得到與染色體數對應的連鎖群;
3)采用最小生成樹算法(MST)對標記進行排序,對排序后的SNP標記進行補缺失和糾錯處理,最后計算遺傳距離得到遺傳圖譜。
作為優化,所述遺傳分離群體為性狀分離群體,包括FI、F2、RILd、BC1、DH、Hap中的一種或多種。
作為優化,所述步驟1)包括以下步驟:
1.1)根據親本的基因型及子代的基因型對SNP標記進行基因型分型;例如親本基因型為Aa×Aa,根據孟德爾分離定律,子代的基因型共有AA、Aa和aa三種情況;
1.2)使用卡方檢驗、缺失率對SNP標記進行過濾,得到高質量的SNP標記,具體方法:
1.2.1)使用卡方檢驗過濾SNP標記的方法:
統計子代中每一種基因型的樣本個數,利用卡方檢驗判斷子代各基因型包含的樣本量是否符合孟德爾分離比,如果符合,則保留這一個SNP標記,如果不符合,則過濾該SNP標記;
1.2.2)基于缺失率過濾SNP標記的方法:
基于樣本缺失率:統計所有樣本中某一個SNP標記的缺失與否,如果缺失率(缺失率=缺失樣本數/總樣本)小于設定的閾值(默認為15%),則保留該SNP標記,反之則過濾該SNP標記;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州和壹基因科技有限公司,未經杭州和壹基因科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710804279.2/2.html,轉載請聲明來源鉆瓜專利網。





