[發明專利]一種基因分析注釋方法和裝置有效
| 申請號: | 201710277934.3 | 申請日: | 2017-04-25 |
| 公開(公告)號: | CN107194208B | 公開(公告)日: | 2020-10-02 |
| 發明(設計)人: | 歐陽聆文;吳延安;李明壯;吳一迪;孔令雪 | 申請(專利權)人: | 榮聯科技集團股份有限公司 |
| 主分類號: | G16B40/00 | 分類號: | G16B40/00 |
| 代理公司: | 北京風雅頌專利代理有限公司 11403 | 代理人: | 李弘;楊紅梅 |
| 地址: | 100080 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基因 分析 注釋 方法 裝置 | ||
本發明公開了一種基因分析注釋方法和裝置,所述方法包括:從至少一個現有基因數據庫中抓取第一基因數據;將所述第一基因數據以統一格式存儲,并構建注釋基因數據庫;獲取用于描述基因組變異的標準文件,從所述標準文件中提取檢索值;根據所述檢索值,在所述注釋基因數據庫中檢索得到第二基因數據;其中,所述檢索值包括:變異位點的染色體編號、變異位點的起始位置、參考基因組的堿基、變異位點的堿基;根據所述第二基因數據,對所述標準文件進行基因注釋,生成基因分析注釋結果報告。本發明能夠準確、高效的進行基因分析注釋。
技術領域
本發明涉及基因檢測技術領域,特別是指一種基因分析注釋方法和裝置。
背景技術
基因測序是一種新型基因檢測技術,能夠從血液或唾液中分析測定基因全序列,預測罹患多種疾病的可能性,個體的行為特征及行為合理,如癌癥或白血病,運動天賦,酒量等。基因測序相關產品和技術已由實驗室研究演變到臨床使用,現有技術中,已經存在一些基于基因測序的基因分析注釋服務,其一般是借助基因測試資料,分析并注釋出變異基因,為用戶提供相應的基因分析注釋報告。但現有的由于基因注釋的數據庫的內容較為單一,且基因注釋時使用的規則較為簡單,使得基因分析注釋的效果低下,且準確性不高。
發明內容
有鑒于此,本發明的目的在于提出一種基因分析注釋方法和裝置,能夠準確、高效的進行基因分析注釋。
基于上述目的本發明提供的一種基因分析注釋方法,包括:
從至少一個現有基因數據庫中抓取第一基因數據;
將所述第一基因數據以統一格式存儲,并構建注釋基因數據庫;
獲取用于描述基因組變異的標準文件,從所述標準文件中提取檢索值;根據所述檢索值,在所述注釋基因數據庫中檢索得到第二基因數據;其中,所述檢索值包括:變異位點的染色體編號、變異位點的起始位置、參考基因組的堿基、變異位點的堿基;
根據所述第二基因數據,對所述標準文件進行變異基因注釋,生成基因分析注釋結果報告。
在一些實施方式中,所述從至少一個現有基因數據庫中抓取第一基因數據包括:
獲取所述現有基因數據庫中多個頁面的URL地址;
根據預設的抓取規則,抓取目標頁面;
對所述目標頁面進行解析,獲得所述第一基因數據。
在一些實施方式中,所述第二基因數據包括:
變異在單核苷酸多態性數據庫中的編號、基因ID、基因名稱、人類基因組變異協會的變異命名規則、突變類型、變異位點所處的染色體區段、等位基因突變頻率、等位基因狀態、遺傳模式、在線人類孟德爾遺傳數據庫編號。
在一些實施方式中,所述根據所述檢索值,在所述注釋基因數據庫中檢索得到第二基因數據之后,還包括:
若所述第二基因數據的數據量小于預設閾值,則將變異位點反轉為負鏈堿基并重新根據所述檢索值,在所述注釋基因數據庫中檢索以獲取所述第二基因數據。
在一些實施方式中,所述根據所述第二基因數據,對所述標準文件進行基因注釋,生成基因分析注釋結果報告之后,還包括:
過濾掉所述基因分析注釋結果報告中測序深度小于10×的數據項;
過濾掉所述基因分析注釋結果報告中外顯子上下游5bp至10bp以外的數據項;
過濾掉所述基因分析注釋結果報告中記載同義突變的數據項。
另一方面,本發明還提供了一種基因分析注釋裝置,包括:
抓取模塊,用于從至少一個現有基因數據庫中抓取第一基因數據;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于榮聯科技集團股份有限公司,未經榮聯科技集團股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710277934.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種治療鼻炎的藥物及其制備方法和應用
- 下一篇:一種養生茶及其制備方法和應用





