[發(fā)明專利]一種細菌DNA序列快速注釋方法及裝置在審

申請?zhí)枺?/td>	202010795329.7	申請日：	2020-08-10
公開（公告）號：	CN112017729A	公開（公告）日：	2020-12-01
發(fā)明（設計）人：	華孝挺;俞云松;陳歡;梁倩;洪文杰;何錦濤;張玲虹	申請（專利權）人：	浙江大學;浙江天科高新技術發(fā)展有限公司
主分類號：	G16B20/30	分類號：	G16B20/30;G16B30/00
代理公司：	杭州求是專利事務所有限公司 33200	代理人：	應孔月
地址：	310058 浙江***	國省代碼：	浙江;33
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種細菌 dna 序列快速注釋方法裝置
鉆瓜網(wǎng) 技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種細菌DNA序列快速注釋方法，其特征在于，包括：

分別構建ResDB、ISDB、IntegronDB和TransposonDB數(shù)據(jù)庫；

獲取待分析的細菌DNA序列；

利用BLASTN程序?qū)⒋治龅募毦鶧NA序列與ResDB、ISDB、IntegronDB和TransposonDB數(shù)據(jù)庫中的一個或多個進行比對；

根據(jù)比對的覆蓋率和一致性，獲得最佳匹配基因和最佳匹配基因?qū)牟樵兓虻谋葘ζ涡蛄行畔?，并輸出注釋結果。

2.根據(jù)權利要求1所述的一種細菌DNA序列快速注釋方法，其特征在于，分別構建ResDB、ISDB、IntegronDB和TransposonDB數(shù)據(jù)庫，包括：

從NCBI下載NCBI細菌耐藥基因ResDB參考數(shù)據(jù)庫，從ISFINDER下載ISDB數(shù)據(jù)庫，從INTERGRALL下載IntegronDB數(shù)據(jù)庫，從The Transposon Registry下載TransposonDB數(shù)據(jù)庫。

3.根據(jù)權利要求1所述的一種細菌DNA序列快速注釋方法，其特征在于，對輸出的注釋結果進行可視化展示。

4.根據(jù)權利要求1所述的一種細菌DNA序列快速注釋方法，其特征在于，可視化展示的內(nèi)容包括四個數(shù)據(jù)庫的基因類型、基因方向、基因數(shù)量和基因位置。

5.根據(jù)權利要求1所述的一種細菌DNA序列快速注釋方法，其特征在于，所述的細菌DNA序列為Fasta或Genbank格式的序列文件，其中Fasta格式的序列文件載入?yún)?shù)為--nucleotide，Genbank格式的序列文件載入?yún)?shù)為--genbank，F(xiàn)asta或Genbank格式的序列文件均還包括以下參數(shù)設置：

輸出文件所在目錄：--resultdir；參考數(shù)據(jù)庫：--databases；匹配序列的最小覆蓋率：--coverage；匹配序列的最小一致性：--identity。

6.根據(jù)權利要求1所述的一種細菌DNA序列快速注釋方法，其特征在于，比對結果包括：

qseqid：查詢序列id號；

sseqid：目標序列id號；

pident：匹配序列百分比；

length：匹配序列長度；

mismatch：錯配堿基個數(shù)；

gapopen：缺口數(shù)目；

qstart：匹配的查詢序列起始位置；

qend：匹配的查詢序列終止位置；

sstart：匹配的目標序列起始位置；

send：匹配的目標序列終止位置；

evalue：期望值；

bitscore：匹配情況打分；

qseq：匹配的查詢序列的核酸序列；

sseq：匹配的目標序列的核酸序列；

slen：匹配的查詢序列的核酸序列長度。

7.根據(jù)權利要求6所述的一種細菌DNA序列快速注釋方法，其特征在于，identity為BLASTN比對結果pident的值；coverage＝(|send-sstart|+1)/slen。

8.根據(jù)權利要求3所述的一種細菌DNA序列快速注釋方法，其特征在于，對輸出的注釋結果進行可視化展示，具體為：

將輸出的注釋結果寫入表格，同時利用Biopython工具將其轉(zhuǎn)換為Genbank文件格式，同時添加上注釋信息；

利用Python django框架及nginx服務器搭建網(wǎng)站，將輸出的比對結果表格在網(wǎng)頁上展示，利用GBrowse和echarts插件將Genbank文件可視化展示。

9.一種細菌DNA序列快速注釋裝置，其特征在于，包括：

數(shù)據(jù)庫構建模塊，用于分別構建ResDB、ISDB、IntegronDB和TransposonDB數(shù)據(jù)庫；

獲取模塊，用于獲取待分析的細菌DNA序列；

比對模塊，用于利用BLASTN程序?qū)⒋治龅募毦鶧NA序列與ResDB、ISDB、IntegronDB和TransposonDB數(shù)據(jù)庫中的一個或多個進行比對；

輸出模塊，用于根據(jù)比對的覆蓋率和一致性，獲得最佳匹配基因和最佳匹配基因?qū)牟樵兓虻谋葘ζ涡蛄行畔?，并輸出注釋結果。

下載完整專利技術內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于浙江大學;浙江天科高新技術發(fā)展有限公司，未經(jīng)浙江大學;浙江天科高新技術發(fā)展有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202010795329.7/1.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

同類專利

專利分類

G 物理

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產(chǎn)權局專利說明書；

2、支持發(fā)明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】