[發明專利]基于KEGG數據庫的注釋方法、裝置、設備和介質在審
| 申請號: | 202011210906.8 | 申請日: | 2020-11-03 |
| 公開(公告)號: | CN112420130A | 公開(公告)日: | 2021-02-26 |
| 發明(設計)人: | 黃龍;韓繼臣;李麗翠 | 申請(專利權)人: | 上海美吉生物醫藥科技有限公司 |
| 主分類號: | G16B50/10 | 分類號: | G16B50/10;G16B30/10;G06F16/951 |
| 代理公司: | 上海光華專利事務所(普通合伙) 31219 | 代理人: | 李治東 |
| 地址: | 201321 上海市浦東新區中國(上海)*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 kegg 數據庫 注釋 方法 裝置 設備 介質 | ||
本申請提供的一種基于KEGG數據庫的注釋方法、裝置、設備和介質,通過按一定頻率從KEGG官方數據庫下載或更新數據文件,并針對不同物種、及層級構建子數據庫;分別提取不同物種的關鍵信息并進行數據整理以得到對應各子數據庫的統一格式的信息文件;利用核酸序列同源性比對尋找同源ID,并根據所述信息文件進行數據注釋;其中,針對不同物種對應的不同層級分別進行數據注釋。本申請能確保數據文件下載完整和更新及時,數據提取準確和全面,比對結果準確和讀取方便,以及確保項目注釋效率高,耗資少。
技術領域
本發明涉及基因注釋技術領域,特別是涉及一種基于KEGG數據庫的注釋方法、裝置、設備和介質。
背景技術
基于高通量測序的數據分析,需要針對測序獲得的基因進行相應的功能注釋,以便在眾多的基因中獲取核心基因進行重點研究。迄今為止,基于注釋的數據挖掘技術,在基礎科研,疾病診斷,藥物研發等方面發揮了重大作用。
當前生命科學領域,在各位業界大咖和學術泰斗的努力下,生物領域的眾多優秀數據庫向各位研究者開源。其中,KEGG數據庫是了解高級功能和生物系統(如細胞、生物和生態系統)的權威數據庫[1]。針對分子水平信息,尤其是大型分子數據集生成的基因組測序和其他高通量實驗技術的實用程序數據庫資源,由日本京都大學生物信息學中心的Kanehisa實驗室于1995年建立。
然而,生命科學領域的研究成果日新月異,KEGG數據的各類注釋信息,每天都在進行更新,學術界對數據庫的使用帶有不同程度的更新延后性,導致一個現象就是各類注釋信息使用的是幾個月以前甚至前幾年的數據來進行基因的功能注釋,可能導致研究者得到的科研結果存在一定的過時甚至錯誤,進而給科學研究帶來不可估量的損失。
目前針對核酸序列的KEGG注釋主要可以通過KOBAS[2]等軟件或者KAAS[3]在線網站進行:其中兩種方式對應的主要步驟、及缺點的對比如下表所示:
表1 KOBAS軟件注釋與KAAS網頁注釋的對比
基于學術界對KEGG數據庫的使用存在不同程度更新延后性及使用問題,本申請的設計要求主要用于滿足:1、數據庫信息直接從KEGG數據庫官方網站獲取,保證數據的完整性。 2、利用爬蟲對KEGG數據實現實時更新,保證數據的準確性。
參考文獻:1.Minoru Kanehisa.The KEGG database.[J].Novartis FoundationSymposium, 2002,247(247):91.
2.XieC,MaoX,HuangJ,DingY,WuJ,DongS,KongL,GaoG,LiCY,WeiL.KOBAS 2.0:aweb server for annotation and identification of enriched pathwaysanddiseases.[J].Nucleic Acids Res,2011.
3.Moriya Y,Itoh M,Okuda S,Yoshizawa AC,Kanehisa M.KAAS:an automaticgenome annotation and pathway reconstruction server.[J].Nucleic AcidsRes.2007Jul;35.
發明內容
鑒于以上所述現有技術的缺點,本申請的目的在于提供一種基于KEGG數據庫的注釋方法、裝置、設備和介質,以解決現有技術中的問題。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海美吉生物醫藥科技有限公司,未經上海美吉生物醫藥科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011210906.8/2.html,轉載請聲明來源鉆瓜專利網。





