[發(fā)明專利]品種鑒定的方法、其預(yù)測模型的構(gòu)建方法和裝置在審
| 申請?zhí)枺?/td> | 202011119585.0 | 申請日: | 2020-10-19 |
| 公開(公告)號: | CN112102880A | 公開(公告)日: | 2020-12-18 |
| 發(fā)明(設(shè)計)人: | 陳志強;梁齊齊;吳俊;曹志生;李瑞強 | 申請(專利權(quán))人: | 北京諾禾致源科技股份有限公司 |
| 主分類號: | G16B20/20 | 分類號: | G16B20/20;G16B20/30 |
| 代理公司: | 北京康信知識產(chǎn)權(quán)代理有限責(zé)任公司 11240 | 代理人: | 路秀麗 |
| 地址: | 102200 北京市昌平區(qū)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 品種 鑒定 方法 預(yù)測 模型 構(gòu)建 裝置 | ||
本發(fā)明提供了一種品種鑒定的方法、其預(yù)測模型的構(gòu)建方法和裝置。其中構(gòu)建方法包括:獲取SNP數(shù)據(jù)集;對SNP數(shù)據(jù)集進行預(yù)處理,得到SNP數(shù)據(jù)矩陣;對SNP數(shù)據(jù)矩陣進行降維處理,得到SNP縮減集;以SNP縮減集為特征值,以樣本所屬群體名作為目標值,進行模型訓(xùn)練及模型參數(shù)調(diào)節(jié),獲得初步模型;對初步模型進行評估,得到品種鑒定的預(yù)測模型。該方法采用主成分分析法等對用于建模的SNP數(shù)據(jù)集進行了降維處理,因而能夠降低運算復(fù)雜度和運算量,提高運算速度,利用該方法及其建立的預(yù)測模型能夠?qū)崿F(xiàn)快速、高通量、自動化得品種鑒定。
技術(shù)領(lǐng)域
本發(fā)明涉及品種鑒定領(lǐng)域,具體而言,涉及一種品種鑒定的方法、其預(yù)測模型的構(gòu)建方法和裝置。
背景技術(shù)
品種是指人類在一定的生態(tài)條件和經(jīng)濟條件下,根據(jù)人類的需要所選育的某一物種的一定群體,它具備相對穩(wěn)定的遺傳特性,在生物學(xué)、形態(tài)學(xué)及經(jīng)濟性狀上具有相對一致性,與同一物種的其他群體在特征上有所區(qū)別即特異性。生物品種鑒定有著廣泛和重要的應(yīng)用價值。品種鑒定促進了對遺傳信息的有效管理;為育種策略的制定與實施奠定良好基礎(chǔ);為生物品牌產(chǎn)品的認證提供了有效信息;更為解決食品安全問題開辟了新途徑。
早前品種鑒定工作主要依賴于表型鑒定,但是隨著雜交育種的推廣,經(jīng)過幾代雜交后的群體的個體表型與親本高度相似,因此,單純利用表型性狀進行品種鑒定不夠準確、全面和科學(xué)。隨后,品種鑒定工作由傳統(tǒng)的表型鑒定發(fā)展為DNA分子標記技術(shù),DNA分子標記的應(yīng)用能夠為品種鑒定提供準確、快速的渠道。早期的DNA分子標記技術(shù)使用微衛(wèi)星、AFLP等標記進行品種鑒定。利用微衛(wèi)星進行品種鑒定的大致過程包括:a)提取待測樣本DNA;b)熒光基團修飾微衛(wèi)星引物;c)降落式PCR擴增;d)讀取每個樣本的基因型信息,用遺傳軟件計算個體之的遺傳距離,根據(jù)遺傳距離繪制聚類圖,以此進行品種鑒定。
然而,上述方法存在以下缺點:a)通用性不強,需要特定引物。由于在不同物種中微衛(wèi)星側(cè)翼序列有所不同,針對不同物種,往往需要進行費時費力的特異性引物設(shè)計。b)結(jié)果誤差高。可能出現(xiàn)同源異型(微衛(wèi)星重復(fù)序列相同,但PCR產(chǎn)物長度不同)或者是異源同型(微衛(wèi)星重復(fù)序列不同,但PCR產(chǎn)物長度相同),單純使用PCR產(chǎn)物片段進行研究可能得出錯誤結(jié)果。此外,PCR擴增受到許多因素影響,使一些等位基因無法被擴增出來,比如發(fā)生在引物3'端配對堿基的突變會嚴重影響PCR效率,進而影響品種鑒定結(jié)果的正確性。c)靈敏度低。由于存在較高的誤差性,在兩個品種間差異性較小時,檢測方法的誤差會掩蓋兩個品種間的差異。
一些學(xué)者利用不同的統(tǒng)計方法結(jié)合遺傳信息對SNP位點進行篩選。Pfaff等人利用δ方法,以兩個物種間的等位基因頻率絕對差為判別標準進行分類,Weir等人利用Wright’sFST方法,依賴于預(yù)先定義的兩個物種間的等位基因頻率的差異最大化進行判別。但是δ和Wright’s FST只可以用于兩個種群的判別,并且沒有清晰的統(tǒng)計特性定義。為解決兩個品種以上的判別,Rosenberg等人提出了一種相關(guān)性衡量的方法,使用互信息(In)描述相關(guān)性,以此來表示不同品種的FST之間的關(guān)系。然而,這些方法不僅運算量和難度較大,而且難以獲得有用的SNP位點。
發(fā)明內(nèi)容
本發(fā)明的主要目的在于提供一種品種鑒定的方法、其預(yù)測模型的構(gòu)建方法和裝置,以實現(xiàn)簡單、高通量、自動化地對品種進行鑒定。
為了實現(xiàn)上述目的,根據(jù)本發(fā)明的一個方面,提供了一種品種鑒定預(yù)測模型的構(gòu)建方法,該構(gòu)建方法包括:獲取SNP數(shù)據(jù)集;對SNP數(shù)據(jù)集進行預(yù)處理,得到SNP數(shù)據(jù)矩陣;對SNP數(shù)據(jù)矩陣進行降維處理,得到SNP縮減集;以SNP縮減集為特征值,以樣本所屬群體名作為目標值,進行模型訓(xùn)練及模型參數(shù)調(diào)節(jié),獲得初步模型;對初步模型進行評估,得到品種鑒定的預(yù)測模型。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京諾禾致源科技股份有限公司,未經(jīng)北京諾禾致源科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011119585.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法、程序以及記錄介質(zhì)
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 基于時間序列預(yù)測模型適用性量化的預(yù)測模型選擇方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 分類預(yù)測方法及裝置、預(yù)測模型訓(xùn)練方法及裝置
- 幀內(nèi)預(yù)測的方法及裝置
- 圖像預(yù)測方法及裝置、電子設(shè)備和存儲介質(zhì)
- 文本預(yù)測方法、裝置以及電子設(shè)備
- 模型融合方法、預(yù)測方法、裝置、設(shè)備及存儲介質(zhì)





