[發(fā)明專利]系譜中染色體區(qū)段的來源推斷的裝置和方法有效
| 申請(qǐng)?zhí)枺?/td> | 201410370365.3 | 申請(qǐng)日: | 2014-07-30 |
| 公開(公告)號(hào): | CN104134018B | 公開(公告)日: | 2017-09-26 |
| 發(fā)明(設(shè)計(jì))人: | 閆軍;張彥麗;侯凌燕;吳俊 | 申請(qǐng)(專利權(quán))人: | 北京諾禾致源科技股份有限公司 |
| 主分類號(hào): | G06F19/18 | 分類號(hào): | G06F19/18 |
| 代理公司: | 北京康信知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司11240 | 代理人: | 吳貴明,張永明 |
| 地址: | 100044 北京市昌平區(qū)*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 系譜 染色體 區(qū)段 來源 推斷 裝置 方法 | ||
1.一種系譜中染色體區(qū)段的來源推斷的方法,其特征在于,所述方法包括以下步驟:
對(duì)系譜內(nèi)所有樣品兩兩進(jìn)行染色體比對(duì),得到所有樣品中兩兩相比所得的相同染色體區(qū)段信息;
根據(jù)所述所有樣品中兩兩相比所得的相同染色體區(qū)段信息,對(duì)全基因組進(jìn)行遺傳區(qū)塊劃分,得到多個(gè)不同類型的遺傳區(qū)段;
根據(jù)每個(gè)所述遺傳區(qū)段的類型的不同,對(duì)所述系譜內(nèi)的所有樣品進(jìn)行遺傳區(qū)段組劃分,得到多組遺傳區(qū)段樣品組;
根據(jù)所述系譜中每三個(gè)樣品之間的已知的局部遺傳關(guān)系,對(duì)每組所述遺傳區(qū)段樣品組中的每個(gè)樣品的各遺傳區(qū)段的遺傳起源進(jìn)行回溯分析,得到每組所述遺傳區(qū)段樣品組中的每個(gè)樣品的各所述遺傳區(qū)段的所有可能的遺傳路徑,并將每條所述遺傳路徑依次所經(jīng)歷的樣品中的最后一個(gè)樣品記為終點(diǎn)樣品;
根據(jù)所有可能的遺傳路徑中每條所述遺傳路徑的終點(diǎn)樣品及各所述終點(diǎn)樣品在系譜內(nèi)樣品的排列順序,將在所述排列順序中位置最靠前的樣品推斷為每組所述遺傳區(qū)段樣品組中的每個(gè)樣品的各所述遺傳區(qū)段的祖先樣品,從而完成系譜中所有樣品的染色體區(qū)段的來源推斷。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述回溯分析步驟通過采用遞歸的方式遍歷已知的每三個(gè)樣品之間的局部遺傳關(guān)系所形成的二叉樹,得到每組所述遺傳區(qū)段樣品組中的每個(gè)樣品的各所述遺傳區(qū)段的所有可能的遺傳路徑。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述回溯分析步驟中每一次遞歸計(jì)算的內(nèi)容如下:
(a)如果系譜中某一待分析樣品的某一遺傳區(qū)段的類型與其某一親本的所述遺傳區(qū)段的類型不相同或所述待分析樣品為系譜中的祖先樣品,則所述待分析樣品的所述遺傳區(qū)段的類型為該樣品本身;
(b)如果系譜中某一待分析樣品的某一遺傳區(qū)段的類型與其某一親本的所述遺傳區(qū)段的類型相同,則在所述遺傳區(qū)段上,將所述待分析樣品與所述親本劃分為同一遺傳區(qū)段組;
并將所述親本作為新的待分析樣品,繼續(xù)進(jìn)行步驟(a)或(b),直到所分析的樣品的兩個(gè)親本與其本身都不相同,則停止分析。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述系譜內(nèi)所有樣品的排列順序?yàn)椋?/p>
當(dāng)所述系譜具有完整的系譜結(jié)構(gòu)信息時(shí),所述系譜內(nèi)所有樣品的排序?yàn)榘凑障底V結(jié)構(gòu)中從最長(zhǎng)輩樣品到最晚輩樣品之間的排列順序;
當(dāng)所述系譜不具有完整的系譜結(jié)構(gòu)信息時(shí),所述系譜內(nèi)所有樣品的排序?yàn)榘凑战?jīng)驗(yàn)進(jìn)行的樣品排序或按照所述回溯分析確定的排序或自己設(shè)定的排列順序。
5.根據(jù)權(quán)利要求1所述的方法,其特在于,在對(duì)系譜內(nèi)所有樣品兩兩進(jìn)行染色體比對(duì),得到所有樣品中兩兩相比所得的相同染色體區(qū)段信息的步驟中,采用IBDseq算法對(duì)系譜內(nèi)所有樣品兩兩進(jìn)行染色體比對(duì)。
6.一種系譜中染色體區(qū)段的來源推斷的裝置,其特征在于,所述裝置還包括:
染色體比對(duì)模塊,用以生成包含系譜內(nèi)所有的樣品經(jīng)兩兩比對(duì)得到的相同染色體區(qū)段信息的文件;
遺傳區(qū)段拆分模塊,與所述染色體比對(duì)模塊相連,通過讀取所述包含系譜內(nèi)所有的樣品經(jīng)兩兩比對(duì)得到的相同染色體區(qū)段信息的文件以將所述系譜物種的全基因組拆分成多個(gè)遺傳區(qū)段,得到多個(gè)不同類型的遺傳區(qū)段;
遺傳區(qū)段樣品分組模塊,與所述遺傳區(qū)段拆分模塊相連,以根據(jù)每個(gè)所述遺傳區(qū)段的類型對(duì)所述系譜內(nèi)所有樣品進(jìn)行遺傳區(qū)段組的劃分,得到多組遺傳區(qū)段樣品組;
遺傳區(qū)段的起源回溯模塊,與所述遺傳區(qū)段樣品分組模塊相連,通過讀取所述遺傳區(qū)段分組模塊輸出的遺傳區(qū)段樣品分組信息,對(duì)每組所述遺傳區(qū)段樣品組中的每個(gè)樣品的各所述遺傳區(qū)段的起源進(jìn)行回溯分析,得到所有可能的遺傳路徑,并將每條所述遺傳路徑依次所經(jīng)歷的樣品中的最后一個(gè)樣品記為終點(diǎn)樣品;
遺傳區(qū)段的祖先確定模塊,所述遺傳區(qū)段的起源回溯模塊相連,通過讀取各所述遺傳區(qū)段的起源回溯模塊中的回溯結(jié)果信息和系譜結(jié)構(gòu)中的樣品排序信息,將位置最靠前的樣品推斷為每組所述遺傳區(qū)段樣品組中的每個(gè)樣品的各所述遺傳區(qū)段的最優(yōu)祖先來源,從而完成系譜中所有樣品的染色體區(qū)段的來源推斷。
7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述遺傳區(qū)段的起源回溯模塊采用遞歸的方式遍歷已知的每三個(gè)樣品之間的局部遺傳關(guān)系所形成的二叉樹,得到每組所述遺傳區(qū)段樣品組中的每個(gè)樣品的各所述遺傳區(qū)段的所有可能的遺傳路徑。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京諾禾致源科技股份有限公司,未經(jīng)北京諾禾致源科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410370365.3/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F19-00 專門適用于特定應(yīng)用的數(shù)字計(jì)算或數(shù)據(jù)處理的設(shè)備或方法
G06F19-10 .生物信息學(xué),即計(jì)算分子生物學(xué)中的遺傳或蛋白質(zhì)相關(guān)的數(shù)據(jù)處理方法或系統(tǒng)
G06F19-12 ..用于系統(tǒng)生物學(xué)的建?;蚍抡?,例如:概率模型或動(dòng)態(tài)模型,遺傳基因管理網(wǎng)絡(luò),蛋白質(zhì)交互作用網(wǎng)絡(luò)或新陳代謝作用網(wǎng)絡(luò)
G06F19-14 ..用于發(fā)展或進(jìn)化的,例如:進(jìn)化的保存區(qū)域決定或進(jìn)化樹結(jié)構(gòu)
G06F19-16 ..用于分子結(jié)構(gòu)的,例如:結(jié)構(gòu)排序,結(jié)構(gòu)或功能關(guān)系,蛋白質(zhì)折疊,結(jié)構(gòu)域拓?fù)?,用結(jié)構(gòu)數(shù)據(jù)的藥靶,涉及二維或三維結(jié)構(gòu)的
G06F19-18 ..用于功能性基因組學(xué)或蛋白質(zhì)組學(xué)的,例如:基因型–表型關(guān)聯(lián),不均衡連接,種群遺傳學(xué),結(jié)合位置鑒定,變異發(fā)生,基因型或染色體組的注釋,蛋白質(zhì)相互作用或蛋白質(zhì)核酸的相互作用
- 一種鑒定植物遠(yuǎn)緣雜交種中外源染色體和染色體片段的方法
- 一種基于深度學(xué)習(xí)的重疊染色體分割方法及裝置
- 一種基于條帶識(shí)別的染色體排序方法
- 一種染色體切割數(shù)據(jù)的處理方法、系統(tǒng)和存儲(chǔ)介質(zhì)
- 彎曲染色體圖像拉直模型生成方法、模型的應(yīng)用、系統(tǒng)、可讀存儲(chǔ)介質(zhì)及計(jì)算機(jī)設(shè)備
- 染色體嵌合體識(shí)別判斷方法、系統(tǒng)及染色體核型分析方法
- 染色體核型圖優(yōu)選拼接方法、系統(tǒng)及染色體核型分析方法
- 自動(dòng)染色體核型分析方法、系統(tǒng)和存儲(chǔ)介質(zhì)
- 染色體異常檢測(cè)裝置
- 一種染色體核型分析中染色體分割方法





