[發明專利]一種應用于基因突變解讀的數據庫及其構建方法在審
| 申請號: | 201710461842.0 | 申請日: | 2017-06-19 |
| 公開(公告)號: | CN107346372A | 公開(公告)日: | 2017-11-14 |
| 發明(設計)人: | 張如奎 | 申請(專利權)人: | 蘇州班凱基因科技有限公司 |
| 主分類號: | G06F19/00 | 分類號: | G06F19/00;G06F19/18;G06F19/28 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 215000 江蘇省蘇州市工業園*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 應用于 基因突變 解讀 數據庫 及其 構建 方法 | ||
技術領域
本發明涉及生物信息數據領域,具體涉及一種應用于基因突變解讀的數據庫及其構建方法。
背景技術
隨著人類基因組計劃(HGP)、腫瘤基因組計劃(TCGA)的完成、基因測序技術的進步、基因測序成本的降低;隨著中國精準醫療計劃被列入國家“十三五”科技發展重大專項,精準醫療被逐漸上升到國家戰略的層面。
基因檢測行業作為精準醫療的前端,它不僅能夠用于罕見遺傳病的檢測,也可用于預測腫瘤化療藥物的療效和副反應,指導腫瘤靶向藥物的選擇,檢測出耐藥的分子機理,評估腫瘤免疫治療,從而指導醫生為病患提供個性化的精準治療方案。而腫瘤的基因檢測技術手段主要是高通量測序,以產生海量的數據,需要專業的數據分析能力為其顯著的特征,整個產業鏈包括高通量檢測實驗操作、生物信息學分析、基因突變數據解讀和臨床注釋三個主要環節。而測序的實驗技術,測序數據的基因組比對技術已經非常成熟,形成了標準化的流程,但是在基因突變數據解讀和臨床注釋環節還處于剛剛萌芽階段,這對整個產業發展形成明顯的掣肘。
目前,對于基因突變的意義解讀多是對散在資料的查閱,難以流程化、規范化且不能保證查閱資料的齊全完備,極大的限制了對基因突變解讀的準確性和完整性,因此構建基因突變解讀數據庫對精準醫學顯得尤為重要。但是目前已有的基因相關數據庫非常之少且只能針對生物學功能、所屬信號通路、突變有害性、突變頻率、相關靶向藥物、預后評估等其中的一個維度進行簡單解讀;更嚴重的缺陷是只能精確到基因,不能精確到具體位點,不能提供嚴格的可溯源的依據證據,這些問題使得目前對基因突變的意義解讀不準確、繁瑣、容易造成遺漏。
發明內容
本發明的目的在于提供一種應用于基因突變解讀的數據庫及其構建方法,用以解決基因突變解讀過程的不規范資料收集、解讀不準確、程序繁瑣、容易造成遺漏的缺陷,以及現有技術中的數據庫信息單一、不能精確到具體位點,不能提供嚴格的可溯源的依據證據的問題。
本發明一方面提供了一種應用于基因突變解讀的數據庫的構建方法,包括:
檢索步驟:人工全面檢索國際上公認的一級數據庫,從該一級數據庫中獲取相關數據資源;
數據提取步驟:對所述數據資源進行分析分解,提取與可干預基因及其位點的相關信息;
完善步驟:搜集相關科學文獻,提取最新研究進展信息;
處理步驟:整合分析所述數據資源及最新研究進展信息,形成內容知識包;
庫構建步驟:建立基因突變解讀數據庫,所述基因突變解讀數據庫包括基因代碼、基因名稱、基因生物學功能,基因所屬信號通路,基因性質,突變類型,熱點突變,突變所在癌種,相關藥物,臨床實驗藥物,臨床意義及其干預機理闡述。
進一步的,所述以及數據庫包括COSMIC、NCBI、FDA/CFDA、ClinicalTrials、NCCN。
進一步的,所述數據提取步驟具體包括:從COSMIC提取熱點突變數據,從NCBI提取基因生物學功能數據,從FDA/CFDA提取相關藥物數據,從ClinicalTrials提取臨床實驗藥物數據,從NCCN提取臨床意義數據。
進一步的,所述完善步驟具體包括:通過Pubmed和Google兩種搜索工具,搜索關鍵詞包括基因、突變位點、基因相關藥物和治療方案的相關科學文獻,提取基因生物學功能、基因所屬信號通路、基因性質、突變類型、熱點突變、突變所在癌種、相關藥物、臨床實驗藥物、臨床意義及其干預機理闡述等方面的最新研究進展信息。
進一步的,所述建立基因突變解讀數據庫包括:以web站點的方式,將HTML+Bootstrap+CSS+JS頁面部署在基于python的輕量級web框架上,整個框架基于WSGI協議構建而成,對外提供統一的增刪改查接口。
進一步的,所述基因突變解讀數據庫采用結構化存儲,以便對數據集合進行分析,通過對某些特征集合做回歸分類分析來獲得隱藏在數據集后的規律。
本發明的另一方面提供一種應用于基因突變解讀的數據庫,包括:
檢索模塊:用于人工全面檢索國際上公認的一級數據庫,從該一級數據庫中獲取相關數據資源;
數據提取模塊:用于對所述數據資源進行分析分解,提取與可干預基因及其位點的相關信息;
完善模塊:用于搜集相關科學文獻,提取最新研究進展信息;
處理模塊:用于整合分析所述數據資源及最新研究進展信息,形成內容知識包;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州班凱基因科技有限公司,未經蘇州班凱基因科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710461842.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種化工用高效蒸餾裝置
- 下一篇:一種醫院端慢性病報病方法及系統
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





