[發(fā)明專(zhuān)利]基于相互作用能項(xiàng)和機(jī)器學(xué)習(xí)的蛋白-配體親和力預(yù)測(cè)方法有效
| 申請(qǐng)?zhí)枺?/td> | 201810735055.5 | 申請(qǐng)日: | 2018-07-06 |
| 公開(kāi)(公告)號(hào): | CN109036580B | 公開(kāi)(公告)日: | 2021-08-20 |
| 發(fā)明(設(shè)計(jì))人: | 季長(zhǎng)鴿;王衛(wèi)軍;張?jiān)鲚x;閆玉娜;段觀福;單金文 | 申請(qǐng)(專(zhuān)利權(quán))人: | 華東師范大學(xué) |
| 主分類(lèi)號(hào): | G16H70/40 | 分類(lèi)號(hào): | G16H70/40 |
| 代理公司: | 上海藍(lán)迪專(zhuān)利商標(biāo)事務(wù)所(普通合伙) 31215 | 代理人: | 徐筱梅;張翔 |
| 地址: | 200241 *** | 國(guó)省代碼: | 上海;31 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 相互作用 機(jī)器 學(xué)習(xí) 蛋白 親和力 預(yù)測(cè) 方法 | ||
1.一種基于相互作用能項(xiàng)和機(jī)器學(xué)習(xí)的蛋白-配體親和力預(yù)測(cè)方法,其特征在于,該方法包括以下具體步驟:
步驟1:從PDBbind數(shù)據(jù)庫(kù)或RCSB-PDB數(shù)據(jù)庫(kù)中得到含配體小分子的蛋白配體復(fù)合物結(jié)晶體結(jié)構(gòu),并從PDBbind數(shù)據(jù)庫(kù)或文獻(xiàn)中得到并提取親和力的活性數(shù)據(jù);
步驟2:通過(guò)PDBFixer軟件對(duì)所有蛋白進(jìn)行預(yù)處理;
步驟3:基于amber99SB力場(chǎng)獲取蛋白原子電荷;
步驟4:計(jì)算找出每個(gè)蛋白配體小分子結(jié)合口袋附近的氨基酸殘基;
步驟5:計(jì)算每個(gè)配體小分子的每個(gè)原子與蛋白結(jié)合口袋中的氨基酸殘基每個(gè)原子的相互作用能;
步驟6:根據(jù)不同氨基酸殘基的主側(cè)鏈形成相互作用能矩陣;
步驟7:調(diào)用隨機(jī)森林的非線性回歸方法;
步驟8:設(shè)置參數(shù)并訓(xùn)練得到打分函數(shù)模型;
步驟9:由獨(dú)立的測(cè)試集進(jìn)行驗(yàn)證;
步驟10:利用打分函數(shù)模型進(jìn)行親和力預(yù)測(cè);其中:
所述根據(jù)不同氨基酸殘基的主側(cè)鏈形成相互作用能矩陣,具體包括:
1將與結(jié)合口袋中所有氨基酸的主鏈原子相關(guān)的相互作用能按范德華相互作用能,氫鍵相互作用能,疏水相互作用能,正的靜電相互作用能,負(fù)的靜電相互作用能合并為5項(xiàng);
2將與結(jié)合口袋中所有氨基酸的側(cè)鏈原子相關(guān)的相互作用能按人體20種不同氨基酸類(lèi)型分別以范德華相互作用能,氫鍵相互作用能,疏水相互作用能,正的靜電相互作用能,負(fù)的靜電相互作用能共合并為100項(xiàng);
3配體小分子原子與金屬的金屬-配體相互作用能合并為1項(xiàng);
4配體小分子的可旋轉(zhuǎn)鍵數(shù)量為1項(xiàng);
共107項(xiàng)相互作用能形成相互作用能矩陣;
所述利用打分函數(shù)模型進(jìn)行親和力預(yù)測(cè),具體包括:
1輸入靶點(diǎn)復(fù)合物中蛋白和小分子三維結(jié)構(gòu)數(shù)據(jù);
2對(duì)蛋白結(jié)構(gòu)進(jìn)行預(yù)處理;
3獲取蛋白活性中心口袋;
4生成107項(xiàng)相互作用能;
5調(diào)用打分函數(shù)模型并輸出給定復(fù)合物親和力預(yù)測(cè)值。
2.根據(jù)權(quán)利要求1所述一種基于相互作用能項(xiàng)和機(jī)器學(xué)習(xí)的蛋白-配體親和力預(yù)測(cè)方法,其特征在于,步驟1中,所述含配體小分子的蛋白配體復(fù)合物結(jié)晶體結(jié)構(gòu)為:要求蛋白-配體的親和力類(lèi)型為Kd或Ki,且所有復(fù)合物配體親和力值于皮摩爾級(jí)、納摩爾級(jí)、微摩爾級(jí)和毫摩爾級(jí)均有超過(guò)100個(gè)的分布。
3.根據(jù)權(quán)利要求1所述一種基于相互作用能項(xiàng)和機(jī)器學(xué)習(xí)的蛋白-配體親和力預(yù)測(cè)方法,其特征在于,步驟2中,所述通過(guò)PDBFixer軟件對(duì)所有蛋白進(jìn)行預(yù)處理包括補(bǔ)齊缺失氨基酸殘基,補(bǔ)齊缺失原子,加氫。
4.根據(jù)權(quán)利要求1所述一種基于相互作用能項(xiàng)和機(jī)器學(xué)習(xí)的蛋白-配體親和力預(yù)測(cè)方法,其特征在于,步驟4中,所述計(jì)算找出每個(gè)蛋白配體小分子結(jié)合口袋附近的氨基酸殘基為:選定蛋白靶標(biāo)PDB晶體結(jié)構(gòu)自身配體周?chē)秶鷥?nèi)的殘基作為蛋白結(jié)合口袋中的氨基酸殘基。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于華東師范大學(xué),未經(jīng)華東師范大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810735055.5/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 根據(jù)用戶學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 游戲?qū)W習(xí)效果評(píng)測(cè)方法及系統(tǒng)





