[發明專利]一種堿基序列的識別方法、裝置和存儲介質有效
| 申請號: | 202010026283.2 | 申請日: | 2020-01-08 |
| 公開(公告)號: | CN111243674B | 公開(公告)日: | 2023-07-04 |
| 發明(設計)人: | 蔡宏民;曾靜文 | 申請(專利權)人: | 華南理工大學 |
| 主分類號: | G16B30/10 | 分類號: | G16B30/10;G16B40/00;G06N3/0464;G06N3/048;G06N3/047;G06N3/0455;G06N3/049;G06N3/08 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 郭浩輝;麥小嬋 |
| 地址: | 510000*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 堿基 序列 識別 方法 裝置 存儲 介質 | ||
本發明公開了一種堿基序列的識別方法,包括步驟:讀取牛津納米孔測序儀輸出的數據文件并提取出待測的DNA/RNA分子對應的電流信號;將所述電流信號按預設的重疊率截取出若干個預設長度的電流信號片段;將每一所述電流信號片段輸入預設的時序卷積網絡模型中進行時序建模,以針對每一電流信號片段生成對應的堿基概率矩陣;其中,所述堿基概率矩陣為所述電流信號片段在每一采樣時間點上出現堿基的概率分布;根據每一所述堿基概率矩陣解碼出對應的堿基序列片段,并根據每一堿基序列片段生成所述堿基序列。本發明實施例還提供了堿基序列的識別裝置和存儲介質。采用本發明實施例,通過時序卷積網絡對電流信號進行時序建模,加快了神經網絡推理速度,提高了堿基序列識別的效率。
技術領域
本發明涉及生物信息技術領域,尤其涉及一種堿基序列的識別方法、裝置和存儲介質。
背景技術
隨著生物學技術的發展,對DNA/RNA分子雙鏈進行堿基序列識別的方法的研究已受到越來越多研究學者的關注。堿基識別的過程即為通過算法將捕獲的電流信號轉換為可識別的堿基序列的過程。在現有的堿基測序方法中,牛津納米孔測序是基于電信號的第三代單分子實時測序技術。DNA/RNA雙鏈在馬達蛋白酶的作用下進行位移,位移過程中納米孔內的離子電流會隨著孔內核酸的移動而波動,將捕獲到的波動的電流信號采用基于循環神經網絡的端到端堿基識別方法(Chiron)進行堿基序列的識別。
然而,在實施本發明過程中,發明人發現現有技術至少存在如下問題:Chiron采用了循環神經網絡對電流信號進行堿基序列識別,在循環神經網絡的推理階段,每個時間點的計算都依賴于前一個時間點的計算結果,且這種循環式的神經網絡也難以執行并行計算,導致Chiron的堿基識別速率較慢,每一秒只能識別2000~3000個堿基。而納米孔測序技術的數據處理量較大,采用Chiron堿基序列識別方法無法較好地滿足納米孔測序技術的數據處理量,因而無法滿足在大規模的堿基測序應用。
發明內容
本發明實施例的目的是提供一種堿基序列的識別方法、裝置和存儲介質,其通過時序卷積網絡對電流信號進行時序建模,加快了神經網絡推理速度,提高了堿基序列識別的效率。
為實現上述目的,本發明實施例提供了一種堿基序列的識別方法,包括步驟:
讀取牛津納米孔測序儀輸出的數據文件并提取出待測的DNA/RNA分子對應的電流信號;
將所述電流信號按預設的重疊率截取出若干個預設長度的電流信號片段;
將每一所述電流信號片段輸入預設的時序卷積網絡模型中進行時序建模,以針對每一電流信號片段生成對應的堿基概率矩陣;其中,所述堿基概率矩陣為所述電流信號片段在每一采樣時間點上出現堿基的概率分布;
根據每一所述堿基概率矩陣解碼出對應的堿基序列片段,并根據每一堿基序列片段生成所述堿基序列。
作為上述方案的改進,所述將所述電流信號按預設的重疊率截取出若干個預設長度的電流信號片段,具體包括:
根據絕對中位差法對所述電流信號進行標準化;
將標準化后的電流信號按預設的重疊率截取出若干個預設長度的電流信號片段。
作為上述方案的改進,所述根據絕對中位差法對所述電流信號進行標準化,具體為:
根據絕對中位差法,通過以下計算公式對所述電流信號進行標準化:
其中,Xsd為標準化后的電流信號;Xraw為標準化前的電流信號;c為預設常數;m(Xraw)為電流信號Xraw的絕對中位差。
作為上述方案的改進,所述根據每一所述堿基概率矩陣解碼出對應的堿基序列片段,并根據每一堿基序列片段生成所述堿基序列,具體包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華南理工大學,未經華南理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010026283.2/2.html,轉載請聲明來源鉆瓜專利網。





