[發(fā)明專利]基于多源信息融合的疾病潛在關(guān)聯(lián)基因的獲取方法有效
| 申請?zhí)枺?/td> | 201210309375.7 | 申請日: | 2012-08-28 |
| 公開(公告)號: | CN102855398A | 公開(公告)日: | 2013-01-02 |
| 發(fā)明(設(shè)計(jì))人: | 高一波;陳迪;盧朋;陳琳;劉西;代文;宋江龍;溫偉娜 | 申請(專利權(quán))人: | 中國科學(xué)院自動化研究所 |
| 主分類號: | G06F19/00 | 分類號: | G06F19/00 |
| 代理公司: | 中科專利商標(biāo)代理有限責(zé)任公司 11021 | 代理人: | 宋焰琴 |
| 地址: | 100190 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 信息 融合 疾病 潛在 關(guān)聯(lián) 基因 獲取 方法 | ||
1.一種基于多源信息融合的疾病潛在關(guān)聯(lián)基因的獲取方法,該方法包括以下步驟:
步驟1:通過基于非相關(guān)文獻(xiàn)知識發(fā)現(xiàn)算法的疾病關(guān)聯(lián)基因預(yù)測步驟獲取第一關(guān)聯(lián)基因集合;
步驟2:通過基于功能相似性算法的疾病關(guān)聯(lián)基因預(yù)測步驟獲取第二關(guān)聯(lián)基因集合;
步驟3:通過基于回歸預(yù)測模型算法的疾病關(guān)聯(lián)基因預(yù)測步驟獲取第三關(guān)聯(lián)基因集合;
步驟4:根據(jù)所述第一、第二和第三關(guān)聯(lián)基因集合及在相應(yīng)步驟下對基因的打分情況,對所述第一、第二和第三關(guān)聯(lián)基因集合中的所有基因重新進(jìn)行打分,得到最終的判決結(jié)果,取排名靠前的作為疾病的潛在關(guān)聯(lián)基因。
2.如權(quán)利要求1所述的方法,其特征在于,所述步驟1包括以下步驟:
步驟11:構(gòu)建疾病的生物網(wǎng)絡(luò);
步驟12:計(jì)算疾病同現(xiàn)表型與通過非相關(guān)文獻(xiàn)關(guān)聯(lián)的基因的相關(guān)度;
步驟13:計(jì)算疾病與關(guān)聯(lián)基因的相關(guān)度,并對得到的基因進(jìn)行排序,得到以非相關(guān)文獻(xiàn)關(guān)聯(lián)為依據(jù)的疾病潛在的關(guān)聯(lián)基因。
3.如權(quán)利要求1所述的方法,其特征在于,所述步驟2包括以下步驟:
步驟21:利用在所述步驟1中得到的疾病同現(xiàn)的基因,計(jì)算同現(xiàn)基因與非同現(xiàn)基因之間功能相似度,利用基因功能相似度的結(jié)果,確定每個(gè)疾病同現(xiàn)基因的10個(gè)相似基因,擴(kuò)展生物網(wǎng)絡(luò);
步驟22:利用相似度計(jì)算排序前10的基因作為疾病同現(xiàn)基因的相似基因,計(jì)算疾病與相似基因的關(guān)聯(lián)度,并對得到的基因進(jìn)行排序,得到以功能相似為依據(jù)的疾病潛在的關(guān)聯(lián)基因。
4.如權(quán)利要求1所述的方法,其特征在于,所述步驟3包括以下步驟:
步驟31:從OMIM數(shù)據(jù)庫中獲取疾病關(guān)聯(lián)基因,獲得與疾病相關(guān)的已知疾病基因,構(gòu)成已知關(guān)聯(lián)基因;從OMIM數(shù)據(jù)庫得到表型網(wǎng)絡(luò),表型之間的相似度利用表型對應(yīng)的醫(yī)學(xué)主題詞表術(shù)語間的重疊程度得到;從人類蛋白質(zhì)相互作用數(shù)據(jù)庫中得到基因相互作用網(wǎng)絡(luò);
步驟32:計(jì)算基因與表型的關(guān)聯(lián)度;
步驟33:根據(jù)已知疾病關(guān)聯(lián)基因評估回歸模型參數(shù);
步驟34:根據(jù)回歸模型預(yù)測潛在的關(guān)聯(lián)基因。
5.如權(quán)利要求1所述的方法,其特征在于,所述步驟4包括以下步驟:
步驟41:利用所述步驟1、2和3獲取疾病的潛在關(guān)聯(lián)基因,其中分別用B表示基于步驟1得到的第一關(guān)聯(lián)基因集合,C表示基于步驟2得到的第二關(guān)聯(lián)基因集合,D表示基于步驟3得到的第三關(guān)聯(lián)基因集合,Bi,Cj,Dk分別為B,C,D的任一子集;
定義集合Θ為基因的集合,E表示Θ的任一子集,Ω=2Θ,即Ω表示所有可能的E集合,Φ表示空集,m為針對潛在關(guān)聯(lián)基因的基本概率分配,是從2Θ到(0,1)上的映射函數(shù),m(E)定義為:
并且滿足:m(Φ)=0,P(gi)表示一個(gè)基因gi在對應(yīng)于獲得集合E所采用步驟1、2或3中得到的打分;
步驟42:按照m(E)的表達(dá)式計(jì)算Bi,Cj,Dk三個(gè)對應(yīng)的基本概率分配m1(Bi),m2(Cj),m3(Dk);
步驟43:對上述三個(gè)基本概率分配進(jìn)行融合,表達(dá)式為:
其中,A滿足:A∈B∪C∪D,且A中僅含一個(gè)元素;即A表示一個(gè)候選疾病潛在關(guān)聯(lián)基因,m1(Bi),m2(Cj),m3(Dk)分別為上述三個(gè)集合Bi,Cj,Dk的基本概率分配;K為歸一化常數(shù),表達(dá)式為:
步驟44:計(jì)算所有滿足條件的A對應(yīng)的m(A),根據(jù)m(A)的值由大到小對基因排序,排序靠前的更有可能作為疾病潛在關(guān)聯(lián)基因。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國科學(xué)院自動化研究所,未經(jīng)中國科學(xué)院自動化研究所許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210309375.7/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F19-00 專門適用于特定應(yīng)用的數(shù)字計(jì)算或數(shù)據(jù)處理的設(shè)備或方法
G06F19-10 .生物信息學(xué),即計(jì)算分子生物學(xué)中的遺傳或蛋白質(zhì)相關(guān)的數(shù)據(jù)處理方法或系統(tǒng)
G06F19-12 ..用于系統(tǒng)生物學(xué)的建模或仿真,例如:概率模型或動態(tài)模型,遺傳基因管理網(wǎng)絡(luò),蛋白質(zhì)交互作用網(wǎng)絡(luò)或新陳代謝作用網(wǎng)絡(luò)
G06F19-14 ..用于發(fā)展或進(jìn)化的,例如:進(jìn)化的保存區(qū)域決定或進(jìn)化樹結(jié)構(gòu)
G06F19-16 ..用于分子結(jié)構(gòu)的,例如:結(jié)構(gòu)排序,結(jié)構(gòu)或功能關(guān)系,蛋白質(zhì)折疊,結(jié)構(gòu)域拓?fù)洌媒Y(jié)構(gòu)數(shù)據(jù)的藥靶,涉及二維或三維結(jié)構(gòu)的
G06F19-18 ..用于功能性基因組學(xué)或蛋白質(zhì)組學(xué)的,例如:基因型–表型關(guān)聯(lián),不均衡連接,種群遺傳學(xué),結(jié)合位置鑒定,變異發(fā)生,基因型或染色體組的注釋,蛋白質(zhì)相互作用或蛋白質(zhì)核酸的相互作用
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置
- 疾病風(fēng)險(xiǎn)預(yù)測方法以及執(zhí)行該方法的裝置
- 利用疾病與人體部位的映射進(jìn)行疾病信息可視化的方法
- 疾病術(shù)語的詞處理方法、裝置及計(jì)算機(jī)設(shè)備
- 一種疾病名稱標(biāo)準(zhǔn)化規(guī)范數(shù)據(jù)庫及其建立方法
- 疾病預(yù)測方法、裝置、終端及存儲介質(zhì)
- 疾病風(fēng)險(xiǎn)預(yù)測方法、裝置、計(jì)算機(jī)設(shè)備及計(jì)算機(jī)存儲介質(zhì)
- 疾病信息識別方法、裝置、計(jì)算機(jī)設(shè)備及存儲介質(zhì)
- 疾病的層級關(guān)系處理方法、裝置及電子設(shè)備
- 一種基于復(fù)雜網(wǎng)絡(luò)的疾病進(jìn)展路徑挖掘方法
- 知識圖譜的構(gòu)建和使用方法、裝置和介質(zhì)





