[發明專利]考慮到準確度的堿基序列對準裝置及方法在審
| 申請號: | 201410598987.1 | 申請日: | 2014-10-30 |
| 公開(公告)號: | CN104598768A | 公開(公告)日: | 2015-05-06 |
| 發明(設計)人: | 樸旻壻 | 申請(專利權)人: | 三星SDS株式會社 |
| 主分類號: | G06F19/18 | 分類號: | G06F19/18 |
| 代理公司: | 北京銘碩知識產權代理有限公司 11286 | 代理人: | 胡江海;孫昌浩 |
| 地址: | 韓國*** | 國省代碼: | 韓國;KR |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 考慮到 準確度 堿基 序列 對準 裝置 方法 | ||
技術領域
本發明的實施例涉及一種用于分析基因組的堿基序列的技術。
背景技術
參考序列與短片段之間的堿基序列對準基本上利用基于堿基序列的同源性(homology)的精確匹配(exact?matching)。然而,由于測序過程中的誤差以及生命體的遺傳信息上的變異(polymorphism)等,因此有必要在堿基序列對準算法中允許一定程度的誤差(失配:mismatch)。
尤其是,在關于特定生命體的整體基因組的研究等中允許所述的一定程度的誤差的堿基序列對準算法會有效。然而,在只對特定疾病(例如,癌癥(cancer))進行診斷的醫療市場中,只對與特定疾病相關聯的部分區域進行分析而不對整體基因組進行分析的情況居多,在這種情況下比起速度更需要準確度高的堿基序列對準算法。
【現有技術文獻】
韓國公開專利公報第10-2013-0060744號(2013.06.10.)
發明內容
本發明的實施例的目的在于提供一種用于更準確地對準從測序儀獲得的大量的短小堿基序列的堿基序列對準方案。
根據本發明的示例性實施例,提供一種堿基序列對準裝置,包括:種子提取單元,從短片段(read)提取與參考序列(reference?sequence)精確匹配的一個以上的種子(seed);映射分值計算單元,針對提取的所述一個以上的種子中的每個,在各個種子的所述參考序列中的各個映射位置以所述種子為中心將所述短片段的左側區域及右側區域分別映射到所述參考序列,并基于所述映射結果來計算所述各個映射位置的左側映射分值及右側映射分值;短片段對準單元,利用計算出的所述左側映射分值及所述右側映射分值來確定所述短片段在所述參考序列中的映射位置。
所述映射分值計算單元可將所述短片段的左側區域從所述短片段的左側區域的與所述種子連接的堿基(base)開始朝左側方向依次映射到所述參考序列,并且可將所述短片段的右側區域從所述短片段的右側區域的與所述種子連接的堿基(base)開始朝右側方向依次映射到所述參考序列。
所述映射分值計算單元可生成將所述短片段的左側區域及與所述左側區域對應的所述參考序列的一部分分別作為列及行的第一矩陣、以及將所述短片段的右側區域及與所述右側區域對應的所述參考序列的一部分分別作為列及行的第二矩陣,并且針對生成的所述第一矩陣及第二矩陣中的各個單元格,賦予根據相關單元格的行值和列值的一致與否來設定的匹配分值或不匹配分值,并且利用被賦予所述匹配分值或不匹配分值的所述第一矩陣及第二矩陣來計算所述左側映射分值及所述右側映射分值。
所述左側映射分值可以是從所述第一矩陣的右上端最后一個單元格開始朝左側、下方或左下端對角線方向中的一個方向依次移動而到達所述第一矩陣的左下端第一個單元格來形成的路徑上賦予的所述匹配分值或不匹配分值的總和中的最大值,所述右側映射分值可以是從所述第二矩陣的左上端第一個單元格開始朝右側、下方或右下端對角線方向中的一個方向依次移動而到達所述第二矩陣的右下端最后一個單元格來形成的路徑上賦予的所述匹配分值或不匹配分值的總和中的最大值。
所述匹配分值可以是大于或等于0的實數,所述不匹配分值可以是小于0的實數。
所述匹配分值可被設定為1,所述不匹配分值可被設定為-1。
所述短片段對準單元可在分別按種子的所述參考序列中的映射位置來計算的所述左側映射分值及所述右側映射分值的總和大于設定的標準值的映射位置中將所述總和最大的映射位置確定為所述短片段的映射位置。
根據本發明的另一個示例性實施例,提供一種堿基序列對準方法,包括如下步驟:在種子提取單元中,從短片段(read)提取與參考序列(reference?sequence)精確匹配的一個以上的種子(seed);在映射分值計算單元中,針對提取的所述一個以上的種子中的每個,在各個種子的所述參考序列中的各個映射位置以所述種子為中心將所述短片段的左側區域及右側區域分別映射到所述參考序列,基于所述映射結果來計算所述各個映射位置的左側映射分值及右側映射分值;在短片段對準單元中,利用計算出的所述左側映射分值及所述右側映射分值來確定所述短片段在所述參考序列中的映射位置。
在計算所述左側映射分值及右側映射分值的步驟中,可將所述短片段的左側區域及所述右側區域從所述短片段的左側區域及右側區域的與所述種子連接的堿基(base)開始朝所述種子的相反方向依次映射到所述參考序列。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于三星SDS株式會社;,未經三星SDS株式會社;許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410598987.1/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





