[發明專利]一種分析處理農作物SSR標記圖譜的方法及其裝置有效
| 申請號: | 201611102076.0 | 申請日: | 2016-12-05 |
| 公開(公告)號: | CN106480215B | 公開(公告)日: | 2017-11-28 |
| 發明(設計)人: | 張憲晨;朱麗;劉越;閆珍臣 | 申請(專利權)人: | 北京華生恒業科技有限公司 |
| 主分類號: | C12Q1/68 | 分類號: | C12Q1/68;C12M1/34 |
| 代理公司: | 北京精金石專利代理事務所(普通合伙)11470 | 代理人: | 劉曄 |
| 地址: | 100083 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 分析 處理 農作物 ssr 標記 圖譜 方法 及其 裝置 | ||
技術領域
本發明一般地涉及生物遺傳學和基因組學領域,并且更特別地,涉及一種分析處理農作物SSR標記圖譜的方法及其裝置。
背景技術
簡單重復序列(Simple Sequence Repeats,SSR),又稱微衛星DNA或短串重復序列(Short Tandem Repeat,STR),通常是以2-5個核苷酸為重復單位經10-50次重復串聯的DNA序列,如(TC)n、(GATA)n、(GAA)n以及(A)n等。同類的簡單重復序列可以分布在整個DNA序列的不同位置上,其長度一般不超過100堿基對(bp)。SSR的長度多態性來源于重復單位拷貝數的個體差異。
相比起其他現有的分子標記技術,如RFLP、PAPD、AFLP以及SNP等,SSR在農作物遺傳信息處理方面具有顯著的優勢:1)SSR在整個DNA序列中有多處分布,數量豐富,能夠充分揭示遺傳多態性;2)由于具有多等位基因的特性,能夠提供更多的遺傳信息;3)SSR為共顯性遺傳,不易被自然和人工選擇淘汰;和4)擴增片段短,易于利用PCR擴增及熒光毛細管電泳產生圖譜,對所檢測的DNA遺傳物質的質量和數量要求相對較低,檢測操作相對簡單,成本相對低廉。利用SSR標記的高多態性,結合相關SSR標記圖譜的處理分析手段,可以對不同親緣農作物物種進行分類,判斷其親緣關系,評價不同農作物品種的異質性,并進而劃分雜交優勢群。
相對于人類遺傳資源的研究,農作物遺傳資源的研究相對落后。目前,由于用于農作物SSR標記的引物設計相對匱乏,也沒有成熟的試劑盒,經PCR擴增和熒光毛細管電泳產生的SSR標記圖譜不但有單峰(純合子)和雙峰(雜合子)還常常存在連續多峰,即一系列等間距、間距不大于2.5bp且峰數大于2的峰,這嚴重影響SSR標記檢測的準確度。
導致連續多峰存在的因素有很多,主要為以下四個方面。N+1峰是連續多峰的主要因素,在用AmpliTaq DNA聚合酶進行PCR擴增時,該酶可以在擴增產物3’端附近加上一個與模板無互補關系的堿基,多數情況下為A,若有的產物不添加,有的產物添加,則會合成長度相差只有1個堿基的兩種DNA擴增產物,分別為“N”峰和“N+1”峰。影子(stutter)峰表現為比相應等位基因主峰弱且相差一個或幾個重復單元的次峰或遞增多峰,其形成原因一般認為是PCR擴增過程中DNA聚合酶在合成DNA時滑動錯配所致。還有,當等位基因如一些雜合等位基因距離較近,例如相差1個或2個重復單元時,如果此時又出現stutter峰,那么極有可能導致幾個峰連起來形成連續多峰。另外,與人類的個體研究相比,農作物一般都是對一個品種的同質群體的整體描述,而非該品種的一個單株。在當樣本純度較低時,例如品種純度為90%時,那么很有可能在正常峰附近出現比例大于10%的另外峰,而當純度更低時則很可能會出現多個雜峰,如果雜峰距離相同則形成連續多峰。
若對連續多峰不加以有效處理會對SSR標記圖譜能否被有效讀取產生很大影響:一是峰不識別,由于滑動造成單個峰的峰高下降,當峰高低于高低峰的閾值時容易被漏讀;二是讀峰位置不穩定,最高的子峰不一定落在最右邊,如果不定義終點峰的確定位置的規則,會造成不同樣品相同峰型的基因型數據有差異;三是讀峰不準確,存在多個與最高子峰峰高接近的子峰時,不僅讀峰位置有誤差而且容易將一個連續多峰識別成多個峰。這些影響會導致農作物SSR標記讀取準確性降低,甚至失敗。目前本領域缺乏對連續多峰的有效處理,連續多峰時常被直接排除只保留最大峰,或僅僅憑借技術人員的個人經驗手動將連續多峰進行調整,如何快速且有效處理農作物SSR標記圖譜中出現的連續多峰問題是本領域技術人員面臨的挑戰。
發明內容
為了解決現有技術無法快速且有效處SSR標記圖譜中出現的連續多峰的問題,本發明的目的是提供一種分析處理農作物SSR標記圖譜的方法,包括曲線處理、內標校準以及片段分析和基因分型3個主要處理步驟,其特征在于,片段分析處理中還包括連續多峰處理,所述連續多峰處理包括以下步驟:
1)連續多峰識別:掃描整個圖譜,識別圖譜是否存在一系列等間距、間距不大于2.5bp且峰數大于2的峰,即連續多峰,若存在則前往下一步驟步驟,不存在則結束連續多峰處理;
2)N+1峰識別:從連續多峰的第一個峰開始,如果后峰與本峰的間距在不大于1.2bp則將后峰加入至N+1峰組,若后峰與本峰的間距均大于1.2bp則前往步驟6;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京華生恒業科技有限公司,未經北京華生恒業科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611102076.0/2.html,轉載請聲明來源鉆瓜專利網。





