[發明專利]一種基因檢測知識庫構建方法及系統有效
| 申請號: | 201710165871.2 | 申請日: | 2017-03-20 |
| 公開(公告)號: | CN107169310B | 公開(公告)日: | 2020-06-26 |
| 發明(設計)人: | 江月 | 申請(專利權)人: | 上海基銀生物科技有限公司 |
| 主分類號: | G16B20/30 | 分類號: | G16B20/30;G16B50/00 |
| 代理公司: | 北京細軟智谷知識產權代理有限責任公司 11471 | 代理人: | 付登云 |
| 地址: | 201203 上海市浦東新區自由貿易試*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基因 檢測 知識庫 構建 方法 系統 | ||
本發明涉及一種基因檢測知識庫構建方法及系統,包括:構建數據庫實體表、公共數據庫的關聯表和文本挖掘的關聯表;構建關聯表打分系統;構建數據庫匹配管理系統;本發明采用半自動化半人工的方式進行知識庫搭建,既考慮了人工搭建的偏差和疏漏,又考慮了公共數據庫的可信度差異,整合了文本挖掘算法和公共數據庫信息采集軟件在自動化收集的步驟中,設計了核心庫和候選庫,并有校驗庫將分值模糊的條目進行人工校驗,采用了自動更新的方式對數據庫內容進行管理,設計匹配的知識庫管理系統,便于對數據庫進行內容查詢、校驗、修改和版本管理。
技術領域
本發明涉及生物信息數據庫領域,具體涉及一種基因檢測知識庫構建方法及系統。
背景技術
二代測序技術的發展,使得人類可以越來越方便的獲取最基礎的基因組序列,了解自身的遺傳信息。很多科學研究表明,人類很多疾病、表型和對藥物的反應,都源于個體的遺傳背景差異,也就是每個人DNA序列的差異。從2000年人類基因組計劃開始,越來越多的人類基因組被破譯,這些基因組構成了人類基因組的參考序列。基因檢測的直接目的是,通過對個體的基因組進行測序(或者對部分區域測序),獲取其和參考基因組DNA水平的序列差異,然后再通過和已有知識庫的比對,來預測可能的疾病、表型、藥物反應的關聯。
DNA序列變異和疾病、表型、藥物反應關聯信息的來源一般有:
GWAS(Genome-wide association study):如果對一些有特定疾病、表型和藥物使用的人群進行遺傳信息挖掘,發現他們和參考序列的差異,那么可以推斷,可能是這些DNA水平的差異,最終導致了疾病、表型或者是對藥物的不同反應。
傳統的生物學研究中的生化、遺傳學實驗:通過傳統的生物學研究方法也可以找到大量和疾病、表型或者是對藥物反應的基因變異、蛋白質變異、酶變異等,將這些變異反映到DNA層面,是DNA水平中一類變異的發生。比如,一個疾病是由于一個蛋白質的跨膜區域發生了變異導致離子通道的異常,那么,編碼這個蛋白質的DNA序列中,只要任何有DNA 水平的變異影響了蛋白質的跨膜功能域,就可能導致這個疾病的發生。部分實驗是在模式生物和細胞系完成。
其他:通過研究疾病樣本和對照樣本中基因、蛋白質的表達量差異;通過計算生物學的方法進行功能預測等。
以上,證據來源的不同,可信度也會不同,和疾病等關聯的元素也不相同。應用到DNA水平的序列變異和疾病的關系,會需要不同的記錄和后續處理方式,需要設計并搭建好知識庫。
知識庫搭建是構建基因檢測分析流程中的核心環節。但是現在的知識庫存在以下問題:
搭建一個知識庫需要耗費人力物力,一般需要整合公共數據庫,加上專業人員閱讀科研文獻完成。
公共數據庫層次不齊,并且人工收集總會存在一定的偏差。
很多知識庫會將DNA、RNA、蛋白質等不同層面的信息混淆,比如GWAS是針對DNA層面的結果,而一些疾病相關致病基因的研究是在蛋白質層面,一些和藥物代謝相關的研究是在酶和代謝物層面,雖然最終會歸到DNA層面的變異,但是在數據庫搭建的過程中,應該事先進行區分,以便后續算法開發。
基于文本挖掘等一系列的算法,自動搭建知識庫,但是完全依靠算法構建的知識庫假陽性率和假陰性率都很高,對后續的基因檢測疾病風險分析有很大的影響。
很多知識庫搭建完成之后,有些已有關聯條目也需要根據新科研成果而自動更新,但由于這些數據庫固化的結構設計,自動更新很難實現。。
很多知識庫都會采用一些公用的數據庫管理軟件,對生物學背景的研究人員不方便使用。
現有發明專利審核中的生物信息相關數據庫,包含了:一種生物信息學數據庫系統和數據處理方法(申請號:201410009130.1)和生物信息數據庫的構建方法和裝置(申請號:201410742604.3)
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海基銀生物科技有限公司,未經上海基銀生物科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710165871.2/2.html,轉載請聲明來源鉆瓜專利網。





