[發明專利]堿基序列比對系統及方法有效
申請號: | 201310368714.3 | 申請日: | 2013-08-22 |
公開(公告)號: | CN103793627B | 公開(公告)日: | 2017-03-01 |
發明(設計)人: | 樸旻胥 | 申請(專利權)人: | 三星SDS株式會社 |
主分類號: | G06F19/22 | 分類號: | G06F19/22 |
代理公司: | 北京銘碩知識產權代理有限公司11286 | 代理人: | 金光軍,韓明星 |
地址: | 韓國*** | 國省代碼: | 暫無信息 |
權利要求書: | 查看更多 | 說明書: | 查看更多 |
摘要: | |||
搜索關鍵詞: | 堿基 序列 系統 方法 | ||
1.一種堿基序列比對系統,包括:
片段序列生成單元,用于由短片段生成多個片段序列;
篩選單元,用于構成只包含所生成的所述多個片段序列當中與參考序列相匹配的片段序列的候選片段序列集合;
映射個數計算單元,將所述參考序列劃分為多個區間,并計算所述多個區間各自的所述候選片段序列的總映射個數;
比對單元,選擇計算出的所述總映射個數為基準個數以上的區間,并對所選擇的區間執行針對所述短片段的全局比對。
2.如權利要求1所述的堿基序列比對系統,其特征在于,從所述短片段的第一個堿基開始每移動設定的間距,所述片段序列生成單元便讀取與設定大小一樣大的所述短片段的值,從而生成所述片段序列。
3.如權利要求1所述的堿基序列比對系統,其特征在于,與所述參考序列相匹配的片段序列為與所述參考序列進行精確匹配的結果不一致的堿基數為設定個數以下的片段序列。
4.如權利要求1所述的堿基序列比對系統,其特征在于,還包括片段序列擴增單元,用于計算所述候選片段序列各自在所述參考序列中的映射重復數,并選擇計算出的所述映射重復數超過設定值的片段序列,且將所選擇的片段序列的大小擴增,直到所述候選片段序列在所述參考序列中的映射位置個數達到所述設定值以下。
5.如權利要求4所述的堿基序列比對系統,其特征在于,所述片段序列擴增單元用于在所述選擇的片段序列的起始端或末端上增加對應于相應位置的所述短片段上的堿基。
6.如權利要求1所述的堿基序列比對系統,其特征在于,所述比對單元選擇所述候選片段序列當中映射于所述選擇的區間的候選片段序列,并在所選擇的各候選片段序列的在所述參考序列內的映射位置上執行針對所述短片段的全局比對。
7.如權利要求6所述的堿基序列比對系統,其特征在于,所述比對單元將所述選擇的區間劃分為多個小區間,并判斷待執行所述全局比對的所述參考序列中的位置所屬的小區間內是否已執行全局比對,且進行所述判斷的結果,只在尚未執行全局比對的情況下執行所述全局比對。
8.如權利要求1所述的堿基序列比對系統,其特征在于,所述映射個數計算單元在計算所述總映射個數的同時計算所述多個區間各自的所述候選片段序列的總映射長度,而所述比對單元在所述總映射個數為基準個數以上的區間當中選擇所述總映射長度為設定基準長度以上的區間,并對選擇的區間執行針對所述短片段的全局比對。
9.如權利要求8所述的堿基序列比對系統,其特征在于,在所述選擇的區間為多個的情況下,所述比對單元根據多個區間各自的總映射個數或總映射長度而依次對所述短片段執行全局比對。
10.如權利要求8所述的堿基序列比對系統,其特征在于,所述基準個數至少為2個。
11.如權利要求8所述的堿基序列比對系統,其特征在于,所述基準長度為利用如下兩個數學式計算的值當中較大的值:
H=L–f×e–2s,以及
H=f+s,
其中,H為基準長度,L為短片段的長度,f為片段序列的長度,e為短片段的最大誤差個數,s為各片段序列的移動間距。
12.如權利要求11所述的堿基序列比對系統,其特征在于,所述基準長度滿足如下數學式:
f+s≤H≤L-(f+s)。
13.如權利要求8所述的堿基序列比對系統,其特征在于,所述基準長度為16~59。
14.一種堿基序列比對方法,包括如下步驟:
在片段序列生成單元中,由短片段生成多個片段序列;
在篩選單元中,構成只包含所生成的所述多個片段序列當中與參考序列相匹配的片段序列的候選片段序列集合;
在映射個數計算單元中,將所述參考序列劃分為多個區間,并按所述多個區間分別計算所述候選片段序列的總映射個數;
在比對單元中,選擇計算出的所述總映射個數為基準個數以上的區間,并對所選擇的區間執行針對所述短片段的全局比對,
其中,與所述參考序列相匹配的片段序列為與所述參考序列進行精確匹配的結果不一致的堿基數為設定個數以下的片段序列。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于三星SDS株式會社,未經三星SDS株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310368714.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種面向軌跡的在線流數據水印方法
- 下一篇:一種信息處理方法及冰箱
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用