[發明專利]確定小核酸序列集合的方法及其應用在審
| 申請號: | 201911147900.8 | 申請日: | 2019-11-21 |
| 公開(公告)號: | CN112825267A | 公開(公告)日: | 2021-05-21 |
| 發明(設計)人: | 朱欠華;楊林峰 | 申請(專利權)人: | 深圳華大基因科技服務有限公司 |
| 主分類號: | G16B30/10 | 分類號: | G16B30/10 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 肖陽 |
| 地址: | 518083 廣東省深圳市鹽*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 確定 核酸 序列 集合 方法 及其 應用 | ||
本發明提出了一種確定小核酸序列集合的方法。該方法包括:(1)將由多個測序讀段構成的測序結果劃分為多個測序讀段集合,所述測序結果是基于含有小RNA分子的核酸樣本獲得的;(2)針對所述多個測序讀段集合的每一個,分別基于比對處理進行合并,以便獲得多個合并測序讀段集合;(3)基于比對處理,將所述多個合并測序讀段集合進行合并,以便獲得候選小核酸序列集合。
技術領域
本發明涉及生物信息領域,具體地,本發明涉及確定小核酸序列集合的方法及其應用,更具體地,本發明涉及確定小核酸序列集合的方法、計算機可讀存儲介質、電子設備以及確定小核酸序列集合的系統。
背景技術
目前small RNA的預測方法,主要是基于其結構特征來預測,例如通過miRNA的前體的二級結構來預測潛在的miRNA,通過正負鏈的幾乎完全互補及1~2個堿基的粘性末端來預測潛在的siRNA以及基于轉座子序列預測piRNA等,這些方法都是針對特定類型的small RNA分子,進行相應的預測。
目前主要的small RNA預測軟件,只能對miRNA、siRNA、piRNA等少數類型的smallRNA進行預測,而且其結果準確性很大程度上都是依賴于基因組的完整性。
因此,對于small RNA預測方法仍需要科研工作者的進一步開發和改進。
發明內容
本發明旨在至少在一定程度上解決相關技術中的技術問題之一。
在本發明的第一方面,本發明提出了一種確定小核酸序列集合的方法。根據本發明的實施例,所述方法包括:(1)將由多個測序讀段構成的測序結果劃分為多個測序讀段集合,所述測序結果是基于含有小RNA分子的核酸樣本獲得的;(2)針對所述多個測序讀段集合的每一個,分別基于比對處理進行合并,以便獲得多個合并測序讀段集合;(3)基于比對處理,將所述多個合并測序讀段集合進行合并,以便獲得候選小核酸序列集合,其中,在步驟(2)中,針對預定所述測序讀段集合,所述合并進一步包括:(2-1)將所述預定測序讀段集合中的所述多個測序讀段進行兩兩比對,并基于比對結果進行兩兩合并,以便獲得與所述預定測序讀段集合對應的所述合并測序讀段集合;以及(2-2)將所述預定測序讀段集合中的成員與步驟(2-1)中得到的所述合并測序讀段集合的成員進行兩兩比對,并將比對結果進行兩兩合并,并基于合并結果對所述合并測序讀段集合進行更新。根據本發明實施例的確定小核酸序列集合的方法,是基于測序的原始數據進行小核酸預測,降低了對基因組和小核酸結構特征的依賴,并且采用動態規劃的構建潛在小核酸序列集合,預測結果更全面。
根據本發明的實施例,上述確定小核酸序列集合的方法還可以進一步包括如下附加技術特征至少之一:
根據本發明的實施例,步驟(2)、(3)、(2-1)和(2-2)中的比對處理分別獨立地采用下列比對方法:獲取待比對的第一核酸序列與第二核酸序列各位置上的基本單元信息;基于所述基本單元信息,構建得分矩陣,其中,m為所述第一核酸序列的基本單元數目,n為所述第二核酸序列的基本單元數目,其中所述得分矩陣中的元素Mij表示所述第一核酸序列中第i個基本單元與所述第二核酸序列中第j個基本單元的比對得分;基于所述得分矩陣的數值,進行回溯處理,以便獲得經過所述第一核酸序列與所述第二核酸序列的比對結果,其中,所述元素Mij是基于下列公式確定的:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳華大基因科技服務有限公司,未經深圳華大基因科技服務有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911147900.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:全電式塑膠射出成型機的控制方法
- 下一篇:一種鋼包智能配包管理方法





