[發明專利]人類常見病遺傳風險評估方法在審
| 申請號: | 201010294493.6 | 申請日: | 2010-09-28 |
| 公開(公告)號: | CN102419791A | 公開(公告)日: | 2012-04-18 |
| 發明(設計)人: | 王一;王穎;金力;黃薇 | 申請(專利權)人: | 上海人類基因組研究中心;復旦大學;上海南方基因科技有限公司 |
| 主分類號: | G06F19/00 | 分類號: | G06F19/00 |
| 代理公司: | 上海浦一知識產權代理有限公司 31211 | 代理人: | 丁紀鐵 |
| 地址: | 201203 上海*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 人類 常見病 遺傳 風險 評估 方法 | ||
技術領域
本發明涉及一種涉及生物醫藥領域的方法,尤其是一種人類常見病遺傳風險評估方法。
背景技術
目前對于疾病風險評估主要技術是邏輯回歸Logistic?Regression,縮寫為LR。
LR的簡要模型如下:
;
其中p為個體患病概率,xi為各種風險因素,例如基因缺陷、不良生活習慣等。ai和b都是回歸系數。該內容在以下參考文獻中有詳細描述:Hilbe,?Joseph?M.?(2009).?Logistic?Regression?Models.?Chapman?&?Hall/CRC?Press.?ISBN?978-1-4200-7575-5。
在LR模型中,事實上假定了:
1.?各個風險因子互相獨立;
2.?這些風險因子之間沒有交互作用。
而現實的情況常常是:
1.?風險因子之間有相關性,例如所謂的“煙酒不分家”,吸煙的人更有可能飲酒;
2.?風險因子之間有交互作用,例如先天性過敏體質的人,在花粉刺激下會導致哮喘。而兩個風險因子單獨作用卻不易導致哮喘。
因此,傳統的LR模型無法很好的在現實條件下進行患病綜合風險評估。
隨著基因檢測技術的進步與普及,如何利用檢測到的個人基因信息結合環境暴露情況來評估特定疾病的患病風險已經成為人們關注的熱點?,F有的邏輯回歸的方法并非為患病風險評估定制,無論應用的可行性與風險評估的準確性都無法滿足實際需求。疾病風險評估有其自身的特點:疾病特別是復雜疾病牽涉到的因子很多,而且其結果不是個因子的簡單累加,使得難以對其建模,從而使得邏輯回歸方法效果欠佳。
發明內容
本發明所要解決的技術問題是提供一種人類常見病遺傳風險評估方法,能夠結合疾病風險評估這一特點,發展出一種能充分利用個人基因信息以及環境暴露情況,但又獨立于對疾病機理假設的通用方法來評估患病風險。
為解決上述技術問題,本發明人類常見病遺傳風險評估方法的技術方案是,包括如下步驟:
建立一個數據庫,該數據庫需要包含健康人與病人的流行病學資料,以及在若干遺傳相關位點上的基因分型資料;
對于以上資料/變量,根據其與疾病的相關性排序,重要的變量列在前面;
對于一個待檢測個體,首先獲取其上述各個資料,作為風險評估的依據;
依據變量的重要程度進行數據庫匹配:比較數據庫中的某樣本與待檢測樣本的第一個變量,如果匹配則繼續比較第二個,第三個,直到無法匹配為止;選擇數據庫中與待檢測樣本最為匹配的前多個樣本;根據這些最匹配的數據庫樣本中的患者比例估計待檢測樣本的患病概率,并用群體患病率校正數據庫樣本采集的偏差。
本發明通過上述方法,不需要對疾病機理有所假設,特別適用于多因子復雜疾?。粚︼L險的評估準確性高;可擴展性好,即隨著樣本庫的增加,風險評估的準確性能持續提高;算法實現容易,速度快。
附圖說明
圖1為本發明人類常見病遺傳風險評估方法中數據庫的示意圖。
具體實施方式
?本發明公開了一種一種人類常見病遺傳風險評估方法,結合圖1所示,包括如下步驟:
建立一個數據庫,該數據庫需要包含健康人與病人的流行病學資料,以及在若干遺傳相關位點上的基因分型資料;
對于以上資料/變量,根據其與疾病的相關性排序,重要的變量列在前面;
對于一個待檢測個體,首先獲取其上述各個資料,作為風險評估的依據;
依據變量的重要程度進行數據庫匹配:比較數據庫中的某樣本與待檢測樣本的第一個變量,如果匹配則繼續比較第二個,第三個,直到無法匹配為止;選擇數據庫中與待檢測樣本最為匹配的前多個樣本;根據這些最匹配的數據庫樣本中的患者比例估計待檢測樣本的患病概率,并用群體患病率校正數據庫樣本采集的偏差。
本發明還包括不斷擴大數據庫的樣本量以及變量數目。
本發明相對于現有的Logisitic?Regression方法:
1.?本發明可以對任意多個風險因子的總體效應進行評估,而現有的LR方法只能做數個風險因子的總體效應評估;
2.?本發明在對待監測個體的鑒別率上,本方法顯著的好于傳統的LR方法。由于前一條原因,在比較兩種方法評估效果的時候,無法使用多達上百個因子的實際數據,這里只展示一次模擬4個因子數據的結果:?
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海人類基因組研究中心;復旦大學;上海南方基因科技有限公司,未經上海人類基因組研究中心;復旦大學;上海南方基因科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010294493.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:MOS晶體管的形成方法
- 下一篇:冰箱半導體制冷芯片散熱組件
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





