[發(fā)明專利]一種基于空間結(jié)構(gòu)的蛋白質(zhì)相互作用預(yù)測(cè)方法有效
| 申請(qǐng)?zhí)枺?/td> | 201910979313.9 | 申請(qǐng)日: | 2019-10-15 |
| 公開(公告)號(hào): | CN110853702B | 公開(公告)日: | 2022-05-24 |
| 發(fā)明(設(shè)計(jì))人: | 張利達(dá);雷雨;洪劍偉;鄭存儉;趙佳薇 | 申請(qǐng)(專利權(quán))人: | 上海交通大學(xué) |
| 主分類號(hào): | G16B15/00 | 分類號(hào): | G16B15/00;G16B20/30;G16B40/00 |
| 代理公司: | 上海科盛知識(shí)產(chǎn)權(quán)代理有限公司 31225 | 代理人: | 丁云 |
| 地址: | 200030 *** | 國(guó)省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 空間結(jié)構(gòu) 蛋白質(zhì) 相互作用 預(yù)測(cè) 方法 | ||
1.一種基于空間結(jié)構(gòu)的蛋白質(zhì)相互作用預(yù)測(cè)方法,其特征在于,該方法包括如下步驟:
(1)采集蛋白質(zhì)三維空間結(jié)構(gòu)標(biāo)準(zhǔn)數(shù)據(jù);
(2)利用三維空間結(jié)構(gòu)標(biāo)準(zhǔn)數(shù)據(jù)構(gòu)建蛋白質(zhì)相互作用正、負(fù)樣本數(shù)據(jù)集;
(3)提取正、負(fù)樣本數(shù)據(jù)集中的蛋白質(zhì)三維空間結(jié)構(gòu)標(biāo)準(zhǔn)數(shù)據(jù)的結(jié)構(gòu)矩陣;
(4)構(gòu)建用于蛋白質(zhì)相互作用預(yù)測(cè)的深度學(xué)習(xí)模型;
(5)將正、負(fù)樣本集中的結(jié)構(gòu)矩陣輸入至深度學(xué)習(xí)模型,訓(xùn)練深度學(xué)習(xí)模型;
(6)對(duì)目標(biāo)蛋白質(zhì)序列進(jìn)行同源建模獲取目標(biāo)蛋白質(zhì)三維空間結(jié)構(gòu)數(shù)據(jù);
(7)提取目標(biāo)蛋白質(zhì)三維空間結(jié)構(gòu)數(shù)據(jù)的結(jié)構(gòu)矩陣;
(8)將目標(biāo)蛋白質(zhì)的結(jié)構(gòu)矩陣輸入至訓(xùn)練好的深度學(xué)習(xí)模型預(yù)測(cè)得到目標(biāo)蛋白質(zhì)相互作用的概率;
步驟(3)和步驟(7)中結(jié)構(gòu)矩陣包括三個(gè),分別為X-Y矩陣、X-Z矩陣和Y-Z矩陣;
結(jié)構(gòu)矩陣通過如下方式得到:
(a)對(duì)氨基酸進(jìn)行數(shù)字編碼,每個(gè)氨基酸對(duì)應(yīng)一個(gè)自然數(shù)編碼;
(b)針對(duì)每個(gè)蛋白質(zhì),從蛋白質(zhì)三維空間結(jié)構(gòu)標(biāo)準(zhǔn)數(shù)據(jù)中提取每個(gè)氨基酸的三維坐標(biāo)(x,y,z),x、y、z對(duì)應(yīng)為X、Y、Z坐標(biāo)值;
(c)對(duì)氨基酸的X、Y、Z坐標(biāo)值進(jìn)行四舍五入取整得到(x′,y′,z′),x′、y′、z′對(duì)應(yīng)為x、y、z的四舍五入取整值,進(jìn)而得到該氨基酸的X-Y矩陣坐標(biāo)點(diǎn)(x′,y′)、X-Z矩陣坐標(biāo)點(diǎn)(x′,z′)和Y-Z矩陣坐標(biāo)點(diǎn)(y′,z′);
(d)對(duì)蛋白質(zhì)中的氨基酸分別在X-Y矩陣坐標(biāo)點(diǎn)、X-Z矩陣坐標(biāo)點(diǎn)和Y-Z矩陣坐標(biāo)點(diǎn)位置處賦值對(duì)應(yīng)的氨基酸自然數(shù)編碼得到X-Y矩陣、X-Z矩陣和Y-Z矩陣。
2.根據(jù)權(quán)利要求1所述的一種基于空間結(jié)構(gòu)的蛋白質(zhì)相互作用預(yù)測(cè)方法,其特征在于,步驟(1)中蛋白質(zhì)三維空間結(jié)構(gòu)標(biāo)準(zhǔn)數(shù)據(jù)為PDB數(shù)據(jù)庫(kù)中的原始蛋白質(zhì)亞基-蛋白質(zhì)亞基復(fù)合體結(jié)構(gòu)數(shù)據(jù)。
3.根據(jù)權(quán)利要求2所述的一種基于空間結(jié)構(gòu)的蛋白質(zhì)相互作用預(yù)測(cè)方法,其特征在于,步驟(2)具體為:
將PDB數(shù)據(jù)庫(kù)中的蛋白質(zhì)亞基復(fù)合體拆分成兩兩互作的蛋白質(zhì)亞基對(duì),形成正樣本數(shù)據(jù)集;
將所有拆分的蛋白質(zhì)亞基隨機(jī)組合構(gòu)成非互作蛋白質(zhì)亞基對(duì),形成負(fù)樣本數(shù)據(jù)集,且負(fù)樣本數(shù)據(jù)集中的數(shù)據(jù)滿足:1)負(fù)樣本數(shù)據(jù)不存在于正樣本數(shù)據(jù)集中,2)負(fù)樣本蛋白質(zhì)對(duì)不同時(shí)存在于同一蛋白質(zhì)復(fù)合體。
4.根據(jù)權(quán)利要求1所述的一種基于空間結(jié)構(gòu)的蛋白質(zhì)相互作用預(yù)測(cè)方法,其特征在于,所述的深度學(xué)習(xí)模型為卷積神經(jīng)網(wǎng)絡(luò)模型。
5.根據(jù)權(quán)利要求4所述的一種基于空間結(jié)構(gòu)的蛋白質(zhì)相互作用預(yù)測(cè)方法,其特征在于,訓(xùn)練深度學(xué)習(xí)模型包括模型參數(shù)的優(yōu)化,所述的模型參數(shù)包括:批尺寸、訓(xùn)練周期、優(yōu)化算法、學(xué)習(xí)速率、Dropout正則化以及隱藏層中神經(jīng)元數(shù)量。
6.根據(jù)權(quán)利要求1所述的一種基于空間結(jié)構(gòu)的蛋白質(zhì)相互作用預(yù)測(cè)方法,其特征在于,步驟(6)采用Modpipe同源建模軟件對(duì)目標(biāo)蛋白質(zhì)序列進(jìn)行同源建模。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海交通大學(xué),未經(jīng)上海交通大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910979313.9/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。





