[發(fā)明專利]基于小樣本的多組學(xué)數(shù)據(jù)中基因型與表型關(guān)聯(lián)分析方法有效
| 申請?zhí)枺?/td> | 202110288323.5 | 申請日: | 2021-03-17 |
| 公開(公告)號: | CN113192556B | 公開(公告)日: | 2022-04-26 |
| 發(fā)明(設(shè)計)人: | 郭新鵬;宋亞飛;劉帥忱;劉樹慧;王藝菲;尚學(xué)群 | 申請(專利權(quán))人: | 西北工業(yè)大學(xué);中國人民解放軍空軍工程大學(xué) |
| 主分類號: | G16B20/20 | 分類號: | G16B20/20;G16B40/30;G16B40/20;G16B50/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 710072 *** | 國省代碼: | 陜西;61 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 樣本 多組學(xué) 數(shù)據(jù) 基因型 表型 關(guān)聯(lián) 分析 方法 | ||
公開一種基于小樣本的多組學(xué)數(shù)據(jù)中基因型與表型關(guān)聯(lián)分析方法,具體包括下列步驟:利用蛋白質(zhì)網(wǎng)絡(luò)和基因表達(dá)值生成帶權(quán)無向基因關(guān)聯(lián)圖,并利用SPICi聚類方法對該無向圖進(jìn)行聚類,生成基因簇;利用group Lasso方法對基因簇進(jìn)行篩選;通過eQTL數(shù)據(jù)得到篩選后的基因簇所對應(yīng)的SNP簇;將每個SNP簇、所對應(yīng)的基因簇及表型構(gòu)建為一個三層網(wǎng)絡(luò)類塊,對每個類塊中SNP與基因關(guān)聯(lián)關(guān)系采用稀疏偏最小二乘方法進(jìn)行回歸運算,對基因與表型關(guān)聯(lián)關(guān)系采用邏輯回歸進(jìn)行運算;對各類塊所得預(yù)測結(jié)果求平均,得到最終預(yù)測結(jié)果。本發(fā)明能夠解決三層網(wǎng)絡(luò)中小樣本情況下特征值龐大不能有效回歸的問題;提高預(yù)測準(zhǔn)確率;使生物意義更加明確;考慮了組織特異性。
技術(shù)領(lǐng)域
本發(fā)明涉及生物信息學(xué)領(lǐng)域,具體涉及一種基于小樣本的多組學(xué)數(shù)據(jù)中基因型與表型關(guān)聯(lián)研究方法。
背景技術(shù)
當(dāng)前遺傳學(xué)的一個重要目標(biāo)是在基因型和表型之間建立完整的功能聯(lián)系,即所謂的基因型表型圖譜。研究基因型與表型關(guān)聯(lián)關(guān)系能夠更加清楚遺傳變異過程。常見的基因型與表型之間的全基因組關(guān)聯(lián)研究(GWAS),是揭示個體遺傳背景與特定疾病或性狀之間聯(lián)系的一種有效途徑。它的原理是找出所有基因組上的差異位點,將差異位點與表型做相關(guān)性分析。在過去的十多年中,大量的全基因組關(guān)聯(lián)研究確定了許多與人類復(fù)雜疾病或其他性狀相關(guān)的遺傳變異。這些發(fā)現(xiàn)能夠識別新型變異性狀關(guān)聯(lián),提供對復(fù)雜性狀的種族變異的洞察力,豐富了多種臨床應(yīng)用。然而,目前發(fā)現(xiàn)的大多數(shù)變異只能夠解釋一小部分的因果遺傳因素。根據(jù)GWAS原理,雖然已經(jīng)發(fā)現(xiàn)數(shù)千個復(fù)雜疾病和特征的單核苷酸多態(tài)性,但單一的組學(xué)層面只能提供有限的生物學(xué)機制,相關(guān)位點的功能含義和機制在很大程度上還不清楚。
由于單一組學(xué)層面上的局限性,需要通過融合其它組學(xué)數(shù)據(jù)更加準(zhǔn)確地預(yù)測基因型與表型之間的生物關(guān)聯(lián)關(guān)系。以數(shù)據(jù)作為支撐,可研究多組學(xué)間的相互作用。這給研究者提供了新的機會來檢測真正的基因型表型關(guān)聯(lián),同時揭示它們的關(guān)聯(lián)機制。通過融合其它組學(xué)數(shù)據(jù)能更加準(zhǔn)確地預(yù)測基因型與表型之間的生物關(guān)聯(lián)關(guān)系,使得遺傳變異過程更加清晰。如結(jié)合基因表達(dá)數(shù)據(jù)分析單核苷酸多態(tài)性(SNP)數(shù)據(jù)對表型的影響。當(dāng)前此類多組學(xué)數(shù)據(jù)融合方法主要有以下兩種思路,一是進(jìn)行“多級融合分析”,二是進(jìn)行“多維融合分析”。
在利用多組學(xué)生物網(wǎng)絡(luò)來挖掘基因型與表型關(guān)聯(lián)關(guān)系時,一般認(rèn)為表型的性狀差異主要由于各組學(xué)逐步影響而產(chǎn)生。如由于SNP的位點差異導(dǎo)致基因表達(dá)發(fā)生變化,進(jìn)而影響蛋白表達(dá)的變化,最后導(dǎo)致疾病的產(chǎn)生。此類逐層融合分析方法通常被稱為“多級融合分析”,主要處理流程是每兩層組學(xué)之間通過線性回歸、偏最小二乘、典型相關(guān)分析、相關(guān)系數(shù)等方法建立組學(xué)間關(guān)聯(lián)關(guān)系,最終通過不同組學(xué)間的層級關(guān)系進(jìn)行疾病預(yù)測等。目前最常用的多級融合方法是“三層法”(S.Lee,S.Kong,E.P.Xing,A network-driven approachfor genome-wide associaion mapping,Bioinformatics,32(2016)i164-i173)。其思路如下:首先利用線性回歸建立SNP與基因間的關(guān)聯(lián)關(guān)系,再利用邏輯回歸建立基因與表型間的關(guān)聯(lián)關(guān)系(表型只有0,1兩種可能,代表是否患有某種疾病)。通過分析SNP對基因表達(dá)量的影響來預(yù)測疾病,相比于用SNP直接預(yù)測疾病更準(zhǔn)確。這證實用三層網(wǎng)絡(luò)更能反應(yīng)真實的生物關(guān)系。然而,三層網(wǎng)絡(luò)進(jìn)行回歸模型建立時,并未考慮各組學(xué)數(shù)據(jù)內(nèi)部之間的關(guān)聯(lián)關(guān)系,造成模型準(zhǔn)確率偏低。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于西北工業(yè)大學(xué);中國人民解放軍空軍工程大學(xué),未經(jīng)西北工業(yè)大學(xué);中國人民解放軍空軍工程大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110288323.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 基于多組學(xué)豐度信息的蛋白質(zhì)二級質(zhì)譜鑒定方法
- 基于病例多組學(xué)變異特征的精準(zhǔn)醫(yī)學(xué)知識搜索系統(tǒng)及實現(xiàn)方法
- 一種多組學(xué)數(shù)據(jù)聯(lián)合分析的方法
- 一種從多組學(xué)數(shù)據(jù)中分析關(guān)聯(lián)變化模式的系統(tǒng)和方法
- 多組學(xué)數(shù)據(jù)擾動云
- 基于D-S證據(jù)理論進(jìn)行多組學(xué)數(shù)據(jù)集成的癌癥亞型分類方法
- 一種非小細(xì)胞肺癌患者術(shù)后復(fù)發(fā)相關(guān)性因素研究方法
- 一種基于深度學(xué)習(xí)的多組學(xué)智能診斷系統(tǒng)
- 用于癌癥基因組和臨床數(shù)據(jù)綜合分析的多組學(xué)搜索引擎
- 單組學(xué)及多組學(xué)KEGG PATHWAY map表達(dá)熱圖個性化展示的方法及應(yīng)用
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





