[發(fā)明專利]基因序列數(shù)據(jù)的處理方法和裝置有效
| 申請(qǐng)?zhí)枺?/td> | 201210147222.7 | 申請(qǐng)日: | 2012-05-11 | 
| 公開(公告)號(hào): | CN102841987A | 公開(公告)日: | 2012-12-26 | 
| 發(fā)明(設(shè)計(jì))人: | 王垚燊;阮航;李萌 | 申請(qǐng)(專利權(quán))人: | 北京諾禾致源生物信息科技有限公司 | 
| 主分類號(hào): | G06F19/22 | 分類號(hào): | G06F19/22 | 
| 代理公司: | 北京康信知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司 11240 | 代理人: | 吳貴明;余剛 | 
| 地址: | 100083 北京市海*** | 國省代碼: | 北京;11 | 
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 | 
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基因 序列 數(shù)據(jù) 處理 方法 裝置 | ||
1.一種基因序列數(shù)據(jù)的處理方法,其特征在于,包括:
接收初始基因序列的測(cè)序數(shù)據(jù);
構(gòu)建所述測(cè)序數(shù)據(jù)的德布魯因圖;
保存所述德布魯因圖中的第一邊序列和組成所述第一邊序列的各個(gè)短序列,其中,所述第一邊序列為所述德布魯因圖中的任一邊序列;
獲取組成所述第一邊序列的各個(gè)短序列的深度信息;
根據(jù)組成所述第一邊序列的各個(gè)短序列的深度信息計(jì)算所述第一邊序列的深度信息;
按照所述德布魯因圖中的各個(gè)邊序列的深度信息和所述測(cè)序數(shù)據(jù)中的各個(gè)短序列化簡所述德布魯因圖;以及
切割化簡后的德布魯因圖,得到所述測(cè)序數(shù)據(jù)的疊連群基因序列。
2.根據(jù)權(quán)利要求1所述的處理方法,其特征在于,按照所述德布魯因圖中的各個(gè)邊序列的深度信息和所述測(cè)序數(shù)據(jù)中的各個(gè)短序列化簡所述德布魯因圖包括:
獲取所述德布魯因圖中第一組合邊序列,其中,所述第一組合邊序列包括第一序列、第二序列和第三序列,所述第二序列連接在所述第一序列和所述第三序列之間,所述第一序列和所述第三序列均包括兩條分支邊序列,所述第二序列包括一條共有邊序列;
判斷所述第一組合邊序列中的各個(gè)邊序列的深度信息是否滿足預(yù)設(shè)條件;
在判定所述第一組合邊序列中的各個(gè)邊序列的深度信息滿足所述預(yù)設(shè)條件時(shí),對(duì)比所述測(cè)序數(shù)據(jù)中的各個(gè)短序列,確定所述第一組合邊序列的基因類型;以及
按照所述基因類型拆解所述第一組合邊序列,得到化簡后的德布魯因圖。
3.根據(jù)權(quán)利要求2所述的處理方法,其特征在于,對(duì)比所述測(cè)序數(shù)據(jù)中的各個(gè)短序列,確定所述第一組合邊序列的基因類型包括:
對(duì)比所述測(cè)序數(shù)據(jù)中的各個(gè)短序列以確定出同屬于一條短序列的第一分支邊序列和第二分支邊序列,其中,所述第一分支邊序列為所述第一序列中的分支邊序列,所述第二分支邊序列為所述第三序列中的分支邊序列;
復(fù)制所述共有邊序列,得到第一共有邊序列和第二共有邊序列;
依次連接所述第一分支邊序列、所述第一共有邊序列和所述第二分支邊序列,將連接后的組合邊序列的類型確定為所述第一組合邊序列的第一基因類型;以及
依次連接第三分支邊序列、所述第二共有邊序列和第四分支邊序列,將連接后的組合邊序列的類型確定為所述第一組合邊序列的第二基因類型,其中,所述第三分支邊序列為所述第一序列中的分支邊序列且所述第三分支邊序列與所述第一分支邊序列不同,所述第四分支邊序列為所述第三序列中的分支邊序列且所述第四分支邊序列與所述第二分支邊序列不同。
4.根據(jù)權(quán)利要求3所述的處理方法,其特征在于,對(duì)比所述測(cè)序數(shù)據(jù)中的各個(gè)短序列以確定出同屬于一條短序列的第一分支邊序列和第二分支邊序列包括:
判斷第一短序列的長度是否大于所述共有邊序列的長度,其中,所述第一短序列為所述各個(gè)短序列中的任一短序列;
在判定所述第一短序列的長度大于所述共有邊序列的長度時(shí),對(duì)比所述第一短序列全部堿基組成以確定出同屬于一條短序列的第一分支邊序列和第二分支邊序列;以及
在判定所述第一短序列的長度小于或等于所述共有邊序列的長度時(shí),對(duì)比所述第一短序列的雙末端堿基組成以確定出同屬于一條短序列的第一分支邊序列和第二分支邊序列。
5.根據(jù)權(quán)利要求2所述的處理方法,其特征在于,判斷所述第一組合邊序列中的各個(gè)邊序列的深度信息是否滿足預(yù)設(shè)條件包括:
判斷所述共有邊序列的深度信息值是否為所述分支邊序列的深度信息值的第一數(shù)值倍,
其中,在判定所述共有邊序列的深度信息值為所述分支邊序列的深度信息值的第一數(shù)值倍時(shí),確定所述第一組合邊序列中的各個(gè)邊序列的深度信息滿足所述預(yù)設(shè)條件。
6.根據(jù)權(quán)利要求1所述的處理方法,其特征在于,根據(jù)組成所述第一邊序列的各個(gè)短序列的深度信息計(jì)算所述第一邊序列的深度信息包括:
計(jì)算組成所述第一邊序列的各個(gè)短序列的深度信息值的平均值;以及
確定計(jì)算出的平均值為所述第一邊序列的深度信息值。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京諾禾致源生物信息科技有限公司,未經(jīng)北京諾禾致源生物信息科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210147222.7/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 上一篇:駕駛輔助裝置
- 下一篇:一種管材切割機(jī)用升降平臺(tái)
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F19-00 專門適用于特定應(yīng)用的數(shù)字計(jì)算或數(shù)據(jù)處理的設(shè)備或方法
G06F19-10 .生物信息學(xué),即計(jì)算分子生物學(xué)中的遺傳或蛋白質(zhì)相關(guān)的數(shù)據(jù)處理方法或系統(tǒng)
G06F19-12 ..用于系統(tǒng)生物學(xué)的建模或仿真,例如:概率模型或動(dòng)態(tài)模型,遺傳基因管理網(wǎng)絡(luò),蛋白質(zhì)交互作用網(wǎng)絡(luò)或新陳代謝作用網(wǎng)絡(luò)
G06F19-14 ..用于發(fā)展或進(jìn)化的,例如:進(jìn)化的保存區(qū)域決定或進(jìn)化樹結(jié)構(gòu)
G06F19-16 ..用于分子結(jié)構(gòu)的,例如:結(jié)構(gòu)排序,結(jié)構(gòu)或功能關(guān)系,蛋白質(zhì)折疊,結(jié)構(gòu)域拓?fù)洌媒Y(jié)構(gòu)數(shù)據(jù)的藥靶,涉及二維或三維結(jié)構(gòu)的
G06F19-18 ..用于功能性基因組學(xué)或蛋白質(zhì)組學(xué)的,例如:基因型–表型關(guān)聯(lián),不均衡連接,種群遺傳學(xué),結(jié)合位置鑒定,變異發(fā)生,基因型或染色體組的注釋,蛋白質(zhì)相互作用或蛋白質(zhì)核酸的相互作用
- 心腦血管疾病易感基因芯片檢測(cè)試劑盒
- 一組用于頭頸部鱗狀細(xì)胞癌分子分型的基因及其應(yīng)用
- 產(chǎn)β-丙氨酸的重組菌及其構(gòu)建方法與應(yīng)用
- 一種檢測(cè)高血壓藥物代謝相關(guān)基因的引物組和試劑盒
- 一組用于腎細(xì)胞癌分子分型的基因及其應(yīng)用
- 一組用于膀胱癌檢測(cè)的基因及其應(yīng)用
- 一組用于髓母細(xì)胞瘤分子分型的基因及其應(yīng)用
- 一種頭發(fā)相關(guān)的基因位點(diǎn)庫及其應(yīng)用
- 馬度米星化合物的生物合成基因簇及其應(yīng)用
- 彌漫性大B細(xì)胞淋巴瘤分子分型試劑盒及分型裝置
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





