[發明專利]一種篩選疾病表型相關突變位點的方法及其應用在審
| 申請號: | 202011599663.1 | 申請日: | 2020-12-29 |
| 公開(公告)號: | CN112735594A | 公開(公告)日: | 2021-04-30 |
| 發明(設計)人: | 張靜波;姬曉勇;徐冰;單光宇;伍啟熹;王建偉;劉倩;唐宇 | 申請(專利權)人: | 北京優迅醫療器械有限公司 |
| 主分類號: | G16H50/70 | 分類號: | G16H50/70;G16B20/20;G16B20/50 |
| 代理公司: | 北京路浩知識產權代理有限公司 11002 | 代理人: | 錢云 |
| 地址: | 102600 北京市大興區中關村科技園區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 篩選 疾病 表型 相關 突變 方法 及其 應用 | ||
本發明涉及生物信息學技術領域,尤其涉及一種篩選疾病表型相關突變位點的方法及其應用。所述方法包括獲得多個疾病樣本和正常樣本的測序數據,進行變異檢出;以樣本的表型、檢出的突變位點的突變類型作為項目總集進行關聯規則挖掘,獲得和疾病樣本的表型具有強關聯關系的突變位點;針對經過關聯規則挖掘篩選得到的突變位點進行建模分析得到和疾病表型相關的突變位點。本發明通過將等位基因轉換為分類變量進行關聯規則挖掘,后針對和疾病表型強關聯的位點進行建模分析,可以有效降低分析的樣本總量,并且避免等位基因頻率對分析結果的影響,只需獲得突變基因型信息即可完成疾病表型相關位點的篩選和分析。
技術領域
本發明涉及生物信息學技術領域,尤其涉及一種篩選疾病表型相關突變位點的方法及其應用。
背景技術
人類遺傳學的中心目標是識別常見復雜疾病(如精神分裂癥和Ⅱ型糖尿病)和罕見孟德爾疾病(如囊性纖維化和鐮狀細胞性貧血)的遺傳風險因素。雖然了解人類健康和疾病的復雜性是目前研究的關鍵之一,但不是人類遺傳學研究的唯一焦點,藥理學領域也是同樣重要的領域。藥物基因學的目的是識別與藥物代謝、療效以及副作用相關的DNA序列變異。例如,法華林是一種稀釋血液的藥物,有助于防止患者生成的血凝塊。在使用法華林的同時,需要嚴格把控為每個病人制定的藥物劑量,并且現有技術普遍認為劑量的多少受到基因所調控。最近的全基因組關聯性分析(Genome-wide association studies,GWAS)表明,幾個基因的DNA序列變異對華法林劑量有很大影響。這些結果,以及驗證性研究,主導了可以用于臨床的華法林劑量的基因測試。這種類型的基因檢測催生了名為“個性化醫療”的新領域,該領域旨在根據患者的遺傳背景和其他生物特征,為其量身定制醫療服務。
GWAS分析應用基因組中數百萬計的單核苷酸多態(single nucleotidepolymorphism,SNP),進行全基因組水平上的對照分析或相關性分析,是通過比較發現影響復雜性狀的基因變異的一種新策略。GWAS分析在全基因組范圍內選擇遺傳變異進行基因分析,基于病例-對照樣本,比較兩組之間每個遺傳變異及其頻率的差異,統計分析每個變異與目標性狀之間的關聯性大小,選出最相關的遺傳變異進行驗證,并根據驗證結果最終確認其與目標性狀之間的相關性。GWAS預測性狀與基因的關聯,其分析結果受多種因素的影響:1)性狀受多少個位點的影響;2)這些位點的等位基因頻率和它們效應量的聯合分布情況;3)實驗的樣本量;4)用于GWAS分析的全基因組變異平臺;5)研究的性狀或疾病的異質性。GWAS的分析結果需要大量樣本來支撐,以便有足夠大的統計學功效,因此,進行GWAS分析的成本往往較高。
Logistic回歸模型是一個分析二分類(如病例-對照等)反應變量的基本工具,也可以分析基因-基因間交互作用。但是Logistic回歸模型在用小樣本量來估計較多參數(如單核苷酸多態性)時存在一定的局限性,每增加一個SNP位點,所需的樣本量將呈指數倍增加,考慮到基因型頻率,即使樣本量較大,數據分布在高維空間仍顯得相對稀疏,很可能出現某系基因組組合沒有觀察值的情況,這種情況稱為“維度困擾”。
關聯規則挖掘被認為是可以從大量數據中篩選新穎、潛在未知的知識和信息的一種有效工具,可以為發現各種屬性包括屬性組合之間的復雜關聯提供許多有益的信息,并且對于處理稀疏和弱相關的數據,效率較高。
發明內容
為了解決現有技術存在的問題,本發明提供一種篩選疾病表型相關突變位點的方法及其應用。本發明通過將等位基因轉換為分類變量進行關聯規則挖掘,后針對和疾病表型強關聯的位點進行建模分析,可以有效降低分析的樣本總量,并且避免等位基因頻率對分析結果的影響。
第一方面,本發明提供一種篩選疾病表型相關突變位點的方法,包括:
獲得多個疾病樣本和正常樣本的測序數據,進行變異檢出;
以樣本的表型、檢出的突變位點的突變類型作為項目總集進行關聯規則挖掘,獲得和疾病樣本的表型具有強關聯關系的突變位點;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京優迅醫療器械有限公司,未經北京優迅醫療器械有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011599663.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種可折向的等截面圓自動煤粉取樣槍
- 下一篇:一種弱口令設備的掃描方法及裝置





