[發明專利]全基因組致病SNP精細定位的因果關聯分析方法在審
| 申請號: | 202111149486.1 | 申請日: | 2021-09-29 |
| 公開(公告)號: | CN113808665A | 公開(公告)日: | 2021-12-17 |
| 發明(設計)人: | 薛付忠;孫曉茹;李洪凱;楊帆 | 申請(專利權)人: | 山東大學 |
| 主分類號: | G16B20/20 | 分類號: | G16B20/20;G16B40/00 |
| 代理公司: | 濟南圣達知識產權代理有限公司 37221 | 代理人: | 祖之強 |
| 地址: | 250014 山*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基因組 致病 snp 精細 定位 因果 關聯 分析 方法 | ||
本發明提供了一種全基因組致病SNP精細定位的因果關聯分析方法,精細定位人類復雜疾病的致病SNP,降低GWAS結果的假陽性率。在因果推斷框架的指導下,構建了面向全基因組的致病位點精細定位的因果GWAS分析策略(CDSFM算法),在脫離具體的因果圖模型的束縛下,通過逐步條件獨立調整策略,有效地降低假陽性率,提升真陽性率,將捕獲致病SNP的命中率提高到90%以上,且具有較高的檢驗效能。
技術領域
本發明涉及生物基因工程技術領域,特別涉及一種全基因組致病SNP精細定位的因果關聯分析方法。
背景技術
本部分的陳述僅僅是提供了與本發明相關的背景技術,并不必然構成現有技術。
自全基因組關聯分析(Genome Wide Association Study,GWAS)方法被提出至今,已發現遍布全基因組14多萬個SNP與4000多種常見疾病存在統計學關聯。然而,很少的SNP得到實驗室功能驗證,難以闡明其遺傳機制。如此高的假陽性率為后續驗證帶來困難的同時,也會導致非遺傳學家對GWAS結果的懷疑。如何進一步精細定位真正的致病SNP,降低假陽性率,是當今研究者廣泛探討的問題。
發明人發現,現已有很多研究者從多角度提出各種精細定位的算法,可大致分為以下四類:
(1)啟發式精細定位法,常見分析思路為通過廣義線性回歸模型和廣義線性混合模型篩選邊際相關的SNP后,根據top SNP與周圍LD的結構,篩選R2大于某一閾值的SNP。但當區域內SNP間高度相關時,這類方法無法有效降低假陽性率。
(2)以條件回歸分析方法為代表的條件回歸法,給定top SNP后,判斷其余SNP的條件P值是否仍有意義,很多時候區域內的top SNP并不一定就是真的致病位點,所以當兩個SNP高度相關時,將影響模型的判斷結果。
(3)以LASSO為代表的懲罰回歸模型,通過判斷回歸系數是否為0進行變量篩選。這種策略下構建的稀疏模型,在SNP高度相關的區域上,僅保留少數幾個SNP,容易誤刪真正的致病SNP。
(4)以貝葉斯變量選擇模型為代表的貝葉斯模型,通過計算SNP為致病位點的后驗概率進行精細定位,這類方法常需要預先設定致病位點個數,錯誤設定將影響分析結果。
發明內容
為了解決現有技術的不足,本發明提供了一種全基因組致病SNP精細定位的因果關聯分析方法,在因果推斷框架的指導下,構建了面向全基因組致病位點精細定位的因果GWAS分析策略與方法(Causal Diagram-based Stepwise Fine-Mapping,CDSFM算法),降低GWAS結果的假陽性率,提高捕獲致病SNP的命中率。
為了實現上述目的,本發明采用如下技術方案:
本發明第一方面提供了一種全基因組致病SNP精細定位的因果關聯分析方法。
全基因組致病SNP精細定位的因果關聯分析方法,包括以下過程:
獲取待分析的基因組數據;
使用單因素回歸模型對基因組數據進行全基因組關聯分析,篩選P值低于預設閾值的顯著SNP,定義顯著的SNP為第一備選基因集,將第一備選基因集中的SNP按照P值從小到大進行排序;
固定第一備選基因集中P值最小的SNP01,剩余SNP構成第一備選基因子集,SNP01與第一備選基因子集中的SNP輪流對結局做二元回歸分析,檢驗兩個SNP與結局的條件獨立性,根據剔除條件判斷是否將被檢驗的SNP從第一備選基因集中剔除;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山東大學,未經山東大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111149486.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:保溫模板一體化材料
- 下一篇:用于漁業生產的節能型水氧機自動化生產線





