[發(fā)明專利]一種融合全局和局部拓?fù)浣Y(jié)構(gòu)的蛋白質(zhì)復(fù)合體的檢測(cè)方法在審
| 申請(qǐng)?zhí)枺?/td> | 202010767169.5 | 申請(qǐng)日: | 2020-08-03 |
| 公開(公告)號(hào): | CN112071362A | 公開(公告)日: | 2020-12-11 |
| 發(fā)明(設(shè)計(jì))人: | 劉光明;丁翠;王彬;李愛民;劉雅君;羅靖 | 申請(qǐng)(專利權(quán))人: | 西安理工大學(xué) |
| 主分類號(hào): | G16B20/00 | 分類號(hào): | G16B20/00;G16B40/30 |
| 代理公司: | 西安弘理專利事務(wù)所 61214 | 代理人: | 寧文濤 |
| 地址: | 710048 陜*** | 國省代碼: | 陜西;61 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 融合 全局 局部 拓?fù)?/a> 結(jié)構(gòu) 蛋白質(zhì) 復(fù)合體 檢測(cè) 方法 | ||
本發(fā)明公開了一種融合全局和局部拓?fù)浣Y(jié)構(gòu)的蛋白質(zhì)復(fù)合體的檢測(cè)方法,步驟包括:1)獲取多種用于實(shí)驗(yàn)測(cè)試的蛋白質(zhì)互作網(wǎng)絡(luò)數(shù)據(jù)集并對(duì)數(shù)據(jù)集進(jìn)行預(yù)處理;2)將預(yù)處理得到的蛋白質(zhì)互作網(wǎng)絡(luò)數(shù)據(jù)集轉(zhuǎn)換成網(wǎng)絡(luò)對(duì)應(yīng)的鄰接矩陣A;3)依據(jù)蛋白質(zhì)互作網(wǎng)絡(luò)的拓?fù)涮匦詫?duì)非負(fù)矩陣分解算法加以改進(jìn),構(gòu)建一種蛋白質(zhì)復(fù)合體檢測(cè)模型;4)對(duì)步驟3所形成的模型加以多次訓(xùn)練和測(cè)試;5)對(duì)最終輸出的蛋白質(zhì)復(fù)合體進(jìn)行基因的富集分析,為每個(gè)蛋白質(zhì)復(fù)合體標(biāo)注出其代表的生物功能。本發(fā)明融合了蛋白質(zhì)互作網(wǎng)絡(luò)的全局和局部拓?fù)涮匦裕褂酶倪M(jìn)之后的非負(fù)矩陣分解算法構(gòu)建蛋白質(zhì)復(fù)合體檢測(cè)模型,具有良好的表現(xiàn)優(yōu)勢(shì),能夠更加準(zhǔn)確高效的檢測(cè)出蛋白質(zhì)復(fù)合體。
技術(shù)領(lǐng)域
本發(fā)明屬于生命科學(xué)研究領(lǐng)域,具體涉及一種融合全局和局部拓?fù)浣Y(jié)構(gòu)的蛋白質(zhì)復(fù)合體的檢測(cè)方法。
背景技術(shù)
隨著后基因組時(shí)代的到來,生命科學(xué)研究的重點(diǎn)已經(jīng)從基因組學(xué)轉(zhuǎn)向了蛋白質(zhì)組學(xué)。蛋白質(zhì)組學(xué)的一個(gè)重要任務(wù)就是從蛋白質(zhì)-蛋白質(zhì)相互作用網(wǎng)絡(luò)中檢測(cè)出具有一定生物功能的蛋白質(zhì)復(fù)合體。諸如酵母雙雜交、微陣列、蛋白質(zhì)芯片、質(zhì)譜分析法等生物技術(shù)的發(fā)展,人類利用這些技術(shù)產(chǎn)生了大規(guī)模的蛋白質(zhì)相互作用數(shù)據(jù),通過這些相互作用數(shù)據(jù)可以直接構(gòu)建蛋白質(zhì)-蛋白質(zhì)相互作用網(wǎng)絡(luò)。其網(wǎng)絡(luò)的每一個(gè)節(jié)點(diǎn)代表一個(gè)蛋白質(zhì),每一條邊代表蛋白質(zhì)和蛋白質(zhì)之間的相互作用。
蛋白質(zhì)-蛋白質(zhì)相互作用網(wǎng)絡(luò)是生命有機(jī)體內(nèi)一種極其重要的生物分子關(guān)系網(wǎng)絡(luò),從蛋白質(zhì)-蛋白質(zhì)相互作用網(wǎng)絡(luò)中檢測(cè)出蛋白質(zhì)復(fù)合體不僅能夠揭示細(xì)胞組織和功能原理,而且能夠預(yù)測(cè)蛋白質(zhì)功能模塊,在疾病致病基因預(yù)測(cè)以及藥物靶點(diǎn)預(yù)測(cè)方面具有良好的應(yīng)用前景。由于蛋白質(zhì)-蛋白質(zhì)相互作用網(wǎng)絡(luò)具有稀疏性和噪聲數(shù)據(jù)的局限性,本發(fā)明提出了一種融合全局和局部拓?fù)浣Y(jié)構(gòu)的蛋白質(zhì)復(fù)合體的檢測(cè)方法,相對(duì)于傳統(tǒng)的方法,該檢測(cè)方法能夠更準(zhǔn)確高效的挖掘出蛋白質(zhì)復(fù)合體。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種融合全局和局部拓?fù)浣Y(jié)構(gòu)的蛋白質(zhì)復(fù)合體的檢測(cè)方法,相對(duì)于傳統(tǒng)的蛋白質(zhì)復(fù)合體檢測(cè)方法,本發(fā)明的方法提高了蛋白質(zhì)復(fù)合體檢測(cè)的準(zhǔn)確率和精度。
本發(fā)明所采用的技術(shù)方案是,一種融合全局和局部拓?fù)浣Y(jié)構(gòu)的蛋白質(zhì)復(fù)合體的檢測(cè)方法,按照以下步驟實(shí)施:
步驟1、獲取用于實(shí)驗(yàn)測(cè)試的蛋白質(zhì)互作網(wǎng)絡(luò)數(shù)據(jù)集,并對(duì)數(shù)據(jù)集進(jìn)行預(yù)處理;
步驟2、將步驟1預(yù)處理得到的蛋白質(zhì)互作網(wǎng)絡(luò)數(shù)據(jù)集轉(zhuǎn)換成網(wǎng)絡(luò)對(duì)應(yīng)的鄰接矩陣A;
步驟3、依據(jù)蛋白質(zhì)互作網(wǎng)絡(luò)的拓?fù)涮匦詫?duì)非負(fù)矩陣分解算法加以改進(jìn),構(gòu)建一種蛋白質(zhì)復(fù)合體檢測(cè)模型;
步驟4、對(duì)步驟3所形成的模型進(jìn)行訓(xùn)練和測(cè)試,并且使用precision、recall、F-score、Sn、PPV、Acc、MMR七個(gè)指標(biāo)值對(duì)訓(xùn)練結(jié)果進(jìn)行評(píng)估;
步驟5、對(duì)最終輸出的蛋白質(zhì)復(fù)合體進(jìn)行基因的富集分析,從而檢測(cè)出待測(cè)蛋白質(zhì)復(fù)合體所代表的生物功能。
本發(fā)明所采用的技術(shù)方案的特點(diǎn)還在于,
步驟1中預(yù)處理的具體過程為:獲取到的蛋白質(zhì)互作網(wǎng)絡(luò)數(shù)據(jù)集每一行有兩個(gè)蛋白質(zhì)節(jié)點(diǎn),將每個(gè)蛋白質(zhì)節(jié)點(diǎn)的SYMBOL字符串形式均轉(zhuǎn)換成數(shù)字形式,同時(shí)保持蛋白質(zhì)互作網(wǎng)絡(luò)的整體結(jié)構(gòu)不變即可。
步驟2的具體步驟為:
步驟2.1、求出步驟1預(yù)處理之后網(wǎng)絡(luò)數(shù)據(jù)集的最大值n,構(gòu)建一個(gè)n×n的初始矩陣A;
步驟2.2、按行遍歷網(wǎng)絡(luò)數(shù)據(jù)集,將每一行的兩個(gè)蛋白質(zhì)節(jié)點(diǎn)數(shù)字依次作為i、j,并且將初始矩陣A[i][j]置1,其余的置0;
步驟2.3、將初始矩陣A的主對(duì)角線元素置1,即構(gòu)建出鄰接矩陣A。
步驟3具體步驟為:
步驟3.1、根據(jù)步驟2求得的鄰接矩陣A計(jì)算得到蛋白質(zhì)間的自表示系數(shù)矩陣Z;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于西安理工大學(xué),未經(jīng)西安理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010767169.5/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 用于靈活柵格光網(wǎng)絡(luò)全局優(yōu)化的系統(tǒng)架構(gòu)及其全局優(yōu)化方法
- 一種基于多數(shù)據(jù)庫類型的SQL執(zhí)行方法和裝置
- 用于移動(dòng)AdHoc網(wǎng)絡(luò)的路由入侵檢測(cè)系統(tǒng)
- 一種分布式事務(wù)管理方法及系統(tǒng)
- 全局資源分配方法和裝置
- 一種通信方法及裝置
- 一種高效分布式全局鎖協(xié)調(diào)方法
- 一種帶上下文信息編碼的語義分割卷積神經(jīng)網(wǎng)絡(luò)
- 一種批量腳本的全局參數(shù)替換方法及裝置
- 一種基于全局變量的家居參數(shù)化模型建模系統(tǒng)及方法
- 動(dòng)態(tài)分布式環(huán)境中的自動(dòng)拓?fù)湫纬煞椒ā⑾到y(tǒng)及程序產(chǎn)品
- 一種網(wǎng)絡(luò)管理拓?fù)涞奶幚矸椒跋到y(tǒng)
- 物理拓?fù)涫褂霉芾矸椒ê拖到y(tǒng)
- 拓?fù)溥m配方法及裝置
- 一種基于SNMP和HTML5實(shí)現(xiàn)web網(wǎng)絡(luò)拓?fù)涞姆椒?/a>
- 一種網(wǎng)絡(luò)拓?fù)浣y(tǒng)一管理方法及系統(tǒng)
- 一種拓?fù)湟晥D的加載顯示方法及系統(tǒng)
- 開關(guān)磁阻電機(jī)功率拓?fù)渫扑]方法、系統(tǒng)、終端及存儲(chǔ)介質(zhì)
- 靈活定義的城域網(wǎng)網(wǎng)絡(luò)拓?fù)渖煞椒ê脱b置
- 一種網(wǎng)絡(luò)拓?fù)鋬?yōu)化方法、裝置以及系統(tǒng)





