[發明專利]物種基因識別標簽的查找方法、裝置及電子設備在審
| 申請號: | 202110901123.2 | 申請日: | 2021-08-06 |
| 公開(公告)號: | CN113764041A | 公開(公告)日: | 2021-12-07 |
| 發明(設計)人: | 李楊坤 | 申請(專利權)人: | 圓方基因科技(北京)有限公司 |
| 主分類號: | G16B30/00 | 分類號: | G16B30/00;G16B20/00 |
| 代理公司: | 北京知果之信知識產權代理有限公司 11541 | 代理人: | 卜榮麗 |
| 地址: | 100176 北京市大興區北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 物種 基因 識別 標簽 查找 方法 裝置 電子設備 | ||
本發明公開了一種物種基因識別標簽的查找方法、裝置及電子設備,其中方法包括:S1:將目標物種在序列名稱總核酸庫中檢索比對,獲取目標物種的物種信息;S2:根據核酸序列和物種分類地位及名稱進行比對,得到第一比對結果;S3:將第一比對結果進行分類,形成各范圍序列相似度對應的片段池,將范圍序列相似度對應的片段池與序列名稱總核酸庫進行Blastn比對,得到第二比對結果;S4:對第二比對結果進行自動質控,獲取物種特征標簽,并將物種特征標簽與名稱片段標記庫進行Blastn比對,得到目標物種的第一識別標簽和第一識別閾值。本發明將識別標簽與識別閾值結合,有效增加了物種鑒定的種內和種間識別的范圍和準確度;自動進行分析和計算,節省人力。
技術領域
本發明涉及生物技術領域,具體涉及一種物種基因識別標簽的查找方法、裝置及電子設備。
背景技術
基于DNA或RNA技術對物種的鑒定和分類多依賴于保守序列,這種依賴保守序列的物種鑒定方式常見于16S(細菌)、18S(高等真核生物)、ITS(真菌)以及關鍵基因(病毒)。其中,保守序列是指在進化過程中基本保持不變的DNA分子中的核苷酸片段。
相關技術中基于保守序列進行物種鑒定最常見的方法為:(1)采用ClustalW、Bioeidt、T-Coffee、MAFFT和Blastn等比對軟件對兩個以上的已知基因序列進行比對;(2)根據序列相似性完成目的序列片段人工選取后與該物種全基因組序列或局部區域進行引物設計;(3)利用PCR擴增或測序技術獲取序列片段;(4)對所獲取的序列進行拼接或組裝;(5)與數據庫物種已知序列進行比對,從而完成物種的鑒定。
然而,這種方法對很多物種只能鑒定到科或屬的水平,無法鑒定到種內和種間水平;并且,各步驟間需要配備不同專業的人員,依賴操作人員的技術和經驗。
發明內容
本發明的主要目的在于提供一種物種基因識別標簽的查找方法及裝置,以解決生物物種無法鑒定到種內和種間水平,且依賴人工操作的問題。
為了實現上述目的,本發明的第一方面提供了一種物種基因識別標簽的查找方法,包括:
S1:接收輸入的目標物種,并將所述目標物種在序列名稱總核酸庫中檢索比對,獲取所述目標物種的物種信息,所述物種信息包括核酸序列、物種分類地位及名稱;
S2:根據所述核酸序列和物種分類地位及名稱進行比對,得到第一比對結果;
S3:按照序列相似度所處范圍將所述第一比對結果進行分類,形成各范圍序列相似度對應的片段池,并將范圍序列相似度對應的片段池與所述序列名稱總核酸庫進行Blastn比對,得到第二比對結果;
S4:基于配置的剔除序列控制指標對所述第二比對結果進行自動質控,獲取物種特征標簽,并將所述物種特征標簽與名稱片段標記庫進行Blastn比對,得到目標物種的第一識別標簽和第一識別閾值。
可選地,在所述接收輸入的目標物種之前,所述方法還包括:
獲取物種全基因DNA和RNA序列,所述物種全基因DNA和RNA序列包括NT數據庫;
將所述RNA序列反轉錄轉換為DNA序列,構建序列名稱總核酸庫。
可選地,所述根據所述核酸序列和物種分類地位及名稱進行比對,得到第一比對結果,包括:
根據所述物種分類地位及名稱,從所述序列名稱總核酸庫中抽取目標物種所在屬的序列和名稱,形成目標物種所在屬序列池;
將所述核酸序列進行K-mer切分,形成各K值對應的片段池,并從K值對應的片段池提取名稱片段標記庫;
基于配置的第一綜合閾值,將K值對應的片段池與所述目標物種所在屬序列池進行Blastn比對,得到第一比對結果;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于圓方基因科技(北京)有限公司,未經圓方基因科技(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110901123.2/2.html,轉載請聲明來源鉆瓜專利網。





