[發明專利]一種數據庫的建立方法和遺傳疾病的風險預測方法在審
| 申請號: | 201810065335.X | 申請日: | 2018-01-23 |
| 公開(公告)號: | CN108172296A | 公開(公告)日: | 2018-06-15 |
| 發明(設計)人: | 王東梅;李奇 | 申請(專利權)人: | 上海其明信息技術有限公司 |
| 主分類號: | G16H50/30 | 分類號: | G16H50/30 |
| 代理公司: | 北京金信知識產權代理有限公司 11225 | 代理人: | 劉鋒;戎駿京 |
| 地址: | 201203 上海市浦東新區張江高科技園區*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 遺傳疾病 數據庫 風險預測 數據建立 構建 整合 貝葉斯公式 第一數據 數據合并 分類 加權 標準化 預測 記錄 | ||
本發明公開了一種數據庫的建立方法和遺傳疾病的風險預測方法,包括,基于第一數據和第二數據建立第一數據庫;根據所述第一數據庫中的第一屬性對所述第一數據庫進行分類,選擇分類后的第三數據;將所述第二數據與所述第三數據合并,生成整合數據;根據所述整合數據建立第二數據庫。本發明的一種數據庫的建立方法和遺傳疾病的風險預測方法構建了遺傳疾病變異數據庫,并基于所述遺傳疾病變異數據庫結合加權GRS方法和貝葉斯公式構建了遺傳疾病的風險預測的方法,使得所述遺傳疾病變異數據庫的記錄的信息和文字標準化的同時,實現對遺傳疾病的風險的準確預測。
技術領域
本發明涉及一種生物技術領域,尤其涉及一種數據庫的建立方法和遺傳疾病的風險預測方法。
背景技術
目前,復雜疾病,如:胃癌、結腸癌等疾病的遺傳不遵循孟德爾遺傳模式,其發生受多個微效基因及環境因素的影響。復雜疾病在全球范圍內廣泛流行,嚴重危害人類的健康,人們迫切希望從根本上找到這些疾病的發病機理,為疾病的診斷、治療及預防提供基礎和保障。過去十年,隨著高通量分子檢測技術的發展,已經發現了很多疾病相關基因變異位點,尤其是全基因組關聯研究(GWAS)技術的發展,加快了人類常見復雜疾病的研究步伐,發現了很多疾病相關的風險位點(SNP),這些信息的發現為預測疾病風險提供了一種可能。通過預測疾病風險,可以提前預警,督促改變(如:生活方式改變),為個性化醫療,個性化健康管理提供了一種策略。從長遠角度看,個性化醫療通過更精確的診斷,預測潛在疾病的風險,提供更有效、更有針對性的治療,預防某種疾病的發生,防患于未然比“治有病”更節約治療成本。
GWAS被廣泛應用于復雜疾病的遺傳學研究并取得了一系列成果,但是GWAS的位點信息很多都是通過文獻獲得,所以,構建一個信息比較全面的復雜疾病數據GWAS數據庫尤其顯得重要。目前,收集整理GWAS信息的數據庫最主有Clinvar和GWAS,Clinvar是一個公開的數據庫,其中收集了與疾病相關的遺傳變異,包含GWAS中部分重要位點信息。GWAS數據庫中收集了與疾病相關的遺傳變異。盡管這些數據庫收集了大量的疾病相關的位點信息,但是這些信息來源多樣,包含著大量的噪音,不能直接用于疾病風險的預測,因為:1,疾病名稱沒有標準化,由于來源于不同的文獻,很多是人工收集,所以,即使是同一種表型,其命名方式也多種多樣。2,重要信息不全,數據庫信息不全,如進行風險預測的時,需要確定風險等位基因型和OR值。所以,我們對Clinvar數據的疾病名稱進行標準化,并對Clinvar數據庫中的重要信息進行補充,構建了本地復雜疾病數據庫。
復雜疾病GWAS構建好以后,GWAS還面臨著一些挑戰,比如:復雜疾病相關基因位點數目眾多,每一個位點所起到的作用大小不同。GRS(Genetic risk score,遺傳風險評分)能整合多個SNPs的綜合信息來評價基因序列變異和疾病之間的聯系。GRS的構建基于多基因模型,假定疾病的遺傳效應等于各個位點的效應之和,算法分兩種:簡單的GRS和加權的GRS。其中加權GRS更接近于真實事實,該算法認為每個風險等位基因對疾病的影響不同,通過給每個風險等位基因賦予一個相應的權重來顯示不同SNPs對疾病的影響程度不同。
鑒于此,目前,還沒有很好的信息比較全面的復雜疾病變異數據庫,沒有針對遺傳風險評估方法。
針對現有技術中所存在的問題,提供一種數據庫的建立方法和遺傳疾病的風險預測方法具有重要意義。
發明內容
為解決上述問題,本發明提供一種數據庫的建立方法和遺傳疾病的風險預測方法。
為實現上述目的,本發明的一種數據庫的建立方法,基于第一數據和第二數據建立第一數據庫;根據所述第一數據庫中的第一屬性對所述第一數據庫進行分類,選擇分類后的第三數據;將所述第二數據與所述第三數據合并,生成整合數據;根據所述整合數據建立第二數據庫;
進一步地,將所述第二數據與所述第三數據合并,生成整合數據之后,還包括:補充所述整合數據中的缺失數據;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海其明信息技術有限公司,未經上海其明信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810065335.X/2.html,轉載請聲明來源鉆瓜專利網。





