[發明專利]確定小核酸序列集合的方法及其應用在審
| 申請號: | 201911147900.8 | 申請日: | 2019-11-21 |
| 公開(公告)號: | CN112825267A | 公開(公告)日: | 2021-05-21 |
| 發明(設計)人: | 朱欠華;楊林峰 | 申請(專利權)人: | 深圳華大基因科技服務有限公司 |
| 主分類號: | G16B30/10 | 分類號: | G16B30/10 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 肖陽 |
| 地址: | 518083 廣東省深圳市鹽*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 確定 核酸 序列 集合 方法 及其 應用 | ||
1.一種確定小核酸序列集合的方法,其特征在于,包括:
(1)將由多個測序讀段構成的測序結果劃分為多個測序讀段集合,所述測序結果是基于含有小RNA分子的核酸樣本獲得的;
(2)針對所述多個測序讀段集合的每一個,分別基于比對處理進行合并,以便獲得多個合并測序讀段集合;
(3)基于比對處理,將所述多個合并測序讀段集合進行合并,以便獲得候選小核酸序列集合,
其中,在步驟(2)中,針對預定所述測序讀段集合,所述合并進一步包括:
(2-1)將預定測序讀段集合中的所述多個測序讀段進行兩兩比對,并基于比對結果進行兩兩合并,以便獲得與所述預定測序讀段集合對應的所述合并測序讀段集合;以及
(2-2)將所述預定測序讀段集合中的成員與步驟(2-1)中得到的所述合并測序讀段集合的成員進行兩兩比對,并將比對結果進行兩兩合并,并基于合并結果對所述合并測序讀段集合進行更新。
2.根據權利要求1所述的方法,其特征在于,步驟(2)、(3)、(2-1)和(2-2)中的比對處理分別獨立地采用下列比對方法:
獲取待比對的第一核酸序列與第二核酸序列各位置上的基本單元信息;
基于所述基本單元信息,構建得分矩陣Mmn,其中,m為所述第一核酸序列的基本單元數目,n為所述第二核酸序列的基本單元數目,其中所述得分矩陣中的元素Mij表示所述第一核酸序列中第i個基本單元與所述第二核酸序列中第j個基本單元的比對得分;
基于所述得分矩陣Mmn的數值,進行回溯處理,以便獲得經過所述第一核酸序列與所述第二核酸序列的比對結果,
其中,
所述元素Mij是基于下列公式確定的:
其中,
Mi-1,j-1表示所述第一核酸序列中第i-1個基本單元與所述第二核酸序列中第j-1個基本單元的比對得分;
Mi,j-1表示所述第一核酸序列中第i個基本單元與所述第二核酸序列中第j-1個基本單元的比對得分;
Mi-1,j表示所述第一核酸序列中第i-1個基本單元與所述第二核酸序列中第j個基本單元的比對得分;
g表示小于零的第一預定數值;
S(Ri,Sj)是基于所述第一核酸序列中第i個基本單元Ri與所述第二核酸序列中第j個基本單元Sj確定的數值,其中,當Ri與Sj相同時,S(Ri,Sj)為第二預定數值,當Ri與Sj不相同時,S(Ri,Sj)為第三預定數值,所述第三預定數值小于所述第二預定數值。
3.根據權利要求2所述的方法,其特征在于,所述回溯處理是根據下列步驟確定的;
(a)確定所述矩陣Mmn中的最大值所對應的回溯起始位置;
(b)基于所述回溯起始位置上游相鄰三個位置的數值,確定下一回溯位置,其中,所述上游相鄰三個位置包括行相鄰位置、對角線相鄰位置和列相鄰位置,其中,選擇數值最大的位置作為所述下一回溯位置,并且優先選擇所述對角線相鄰位置;
(c)重復步驟(b),直到步驟(b)中所確定的所述下一回溯位置的行號和列號的至少之一為0;
(d)基于步驟(a)-(c)中所確定的回溯路線,確定所述第一生物序列與所述第二生物序列的比對結果。
4.根據權利要求2所述的方法,其特征在于,所述第一預定數值為不小于-10的整數,優選-5。
5.根據權利要求2所述的方法,其特征在于,所述第二預定數值為3。
6.根據權利要求2所述的方法,其特征在于,所述第三預定數值為-3。
7.根據權利要求2所述的方法,其特征在于,所述基本單元為堿基。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳華大基因科技服務有限公司,未經深圳華大基因科技服務有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911147900.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:全電式塑膠射出成型機的控制方法
- 下一篇:一種鋼包智能配包管理方法





