[發(fā)明專利]一種細菌DNA序列快速注釋方法及裝置在審
| 申請?zhí)枺?/td> | 202010795329.7 | 申請日: | 2020-08-10 |
| 公開(公告)號: | CN112017729A | 公開(公告)日: | 2020-12-01 |
| 發(fā)明(設計)人: | 華孝挺;俞云松;陳歡;梁倩;洪文杰;何錦濤;張玲虹 | 申請(專利權)人: | 浙江大學;浙江天科高新技術發(fā)展有限公司 |
| 主分類號: | G16B20/30 | 分類號: | G16B20/30;G16B30/00 |
| 代理公司: | 杭州求是專利事務所有限公司 33200 | 代理人: | 應孔月 |
| 地址: | 310058 浙江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 細菌 dna 序列 快速 注釋 方法 裝置 | ||
1.一種細菌DNA序列快速注釋方法,其特征在于,包括:
分別構建ResDB、ISDB、IntegronDB和TransposonDB數(shù)據(jù)庫;
獲取待分析的細菌DNA序列;
利用BLASTN程序?qū)⒋治龅募毦鶧NA序列與ResDB、ISDB、IntegronDB和TransposonDB數(shù)據(jù)庫中的一個或多個進行比對;
根據(jù)比對的覆蓋率和一致性,獲得最佳匹配基因和最佳匹配基因?qū)牟樵兓虻谋葘ζ涡蛄行畔?,并輸出注釋結果。
2.根據(jù)權利要求1所述的一種細菌DNA序列快速注釋方法,其特征在于,分別構建ResDB、ISDB、IntegronDB和TransposonDB數(shù)據(jù)庫,包括:
從NCBI下載NCBI細菌耐藥基因ResDB參考數(shù)據(jù)庫,從ISFINDER下載ISDB數(shù)據(jù)庫,從INTERGRALL下載IntegronDB數(shù)據(jù)庫,從The Transposon Registry下載TransposonDB數(shù)據(jù)庫。
3.根據(jù)權利要求1所述的一種細菌DNA序列快速注釋方法,其特征在于,對輸出的注釋結果進行可視化展示。
4.根據(jù)權利要求1所述的一種細菌DNA序列快速注釋方法,其特征在于,可視化展示的內(nèi)容包括四個數(shù)據(jù)庫的基因類型、基因方向、基因數(shù)量和基因位置。
5.根據(jù)權利要求1所述的一種細菌DNA序列快速注釋方法,其特征在于,所述的細菌DNA序列為Fasta或Genbank格式的序列文件,其中Fasta格式的序列文件載入?yún)?shù)為--nucleotide,Genbank格式的序列文件載入?yún)?shù)為--genbank,F(xiàn)asta或Genbank格式的序列文件均還包括以下參數(shù)設置:
輸出文件所在目錄:--resultdir;參考數(shù)據(jù)庫:--databases;匹配序列的最小覆蓋率:--coverage;匹配序列的最小一致性:--identity。
6.根據(jù)權利要求1所述的一種細菌DNA序列快速注釋方法,其特征在于,比對結果包括:
qseqid:查詢序列id號;
sseqid:目標序列id號;
pident:匹配序列百分比;
length:匹配序列長度;
mismatch:錯配堿基個數(shù);
gapopen:缺口數(shù)目;
qstart:匹配的查詢序列起始位置;
qend:匹配的查詢序列終止位置;
sstart:匹配的目標序列起始位置;
send:匹配的目標序列終止位置;
evalue:期望值;
bitscore:匹配情況打分;
qseq:匹配的查詢序列的核酸序列;
sseq:匹配的目標序列的核酸序列;
slen:匹配的查詢序列的核酸序列長度。
7.根據(jù)權利要求6所述的一種細菌DNA序列快速注釋方法,其特征在于,identity為BLASTN比對結果pident的值;coverage=(|send-sstart|+1)/slen。
8.根據(jù)權利要求3所述的一種細菌DNA序列快速注釋方法,其特征在于,對輸出的注釋結果進行可視化展示,具體為:
將輸出的注釋結果寫入表格,同時利用Biopython工具將其轉(zhuǎn)換為Genbank文件格式,同時添加上注釋信息;
利用Python django框架及nginx服務器搭建網(wǎng)站,將輸出的比對結果表格在網(wǎng)頁上展示,利用GBrowse和echarts插件將Genbank文件可視化展示。
9.一種細菌DNA序列快速注釋裝置,其特征在于,包括:
數(shù)據(jù)庫構建模塊,用于分別構建ResDB、ISDB、IntegronDB和TransposonDB數(shù)據(jù)庫;
獲取模塊,用于獲取待分析的細菌DNA序列;
比對模塊,用于利用BLASTN程序?qū)⒋治龅募毦鶧NA序列與ResDB、ISDB、IntegronDB和TransposonDB數(shù)據(jù)庫中的一個或多個進行比對;
輸出模塊,用于根據(jù)比對的覆蓋率和一致性,獲得最佳匹配基因和最佳匹配基因?qū)牟樵兓虻谋葘ζ涡蛄行畔?,并輸出注釋結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江大學;浙江天科高新技術發(fā)展有限公司,未經(jīng)浙江大學;浙江天科高新技術發(fā)展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010795329.7/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種車輛通信方法及裝置
- 下一篇:一種喜濕花卉鮮切冷鏈運輸保護箱





