[發明專利]基于相互作用能項和機器學習的蛋白-配體親和力預測方法有效
| 申請號: | 201810735055.5 | 申請日: | 2018-07-06 |
| 公開(公告)號: | CN109036580B | 公開(公告)日: | 2021-08-20 |
| 發明(設計)人: | 季長鴿;王衛軍;張增輝;閆玉娜;段觀福;單金文 | 申請(專利權)人: | 華東師范大學 |
| 主分類號: | G16H70/40 | 分類號: | G16H70/40 |
| 代理公司: | 上海藍迪專利商標事務所(普通合伙) 31215 | 代理人: | 徐筱梅;張翔 |
| 地址: | 200241 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 相互作用 機器 學習 蛋白 親和力 預測 方法 | ||
1.一種基于相互作用能項和機器學習的蛋白-配體親和力預測方法,其特征在于,該方法包括以下具體步驟:
步驟1:從PDBbind數據庫或RCSB-PDB數據庫中得到含配體小分子的蛋白配體復合物結晶體結構,并從PDBbind數據庫或文獻中得到并提取親和力的活性數據;
步驟2:通過PDBFixer軟件對所有蛋白進行預處理;
步驟3:基于amber99SB力場獲取蛋白原子電荷;
步驟4:計算找出每個蛋白配體小分子結合口袋附近的氨基酸殘基;
步驟5:計算每個配體小分子的每個原子與蛋白結合口袋中的氨基酸殘基每個原子的相互作用能;
步驟6:根據不同氨基酸殘基的主側鏈形成相互作用能矩陣;
步驟7:調用隨機森林的非線性回歸方法;
步驟8:設置參數并訓練得到打分函數模型;
步驟9:由獨立的測試集進行驗證;
步驟10:利用打分函數模型進行親和力預測;其中:
所述根據不同氨基酸殘基的主側鏈形成相互作用能矩陣,具體包括:
1將與結合口袋中所有氨基酸的主鏈原子相關的相互作用能按范德華相互作用能,氫鍵相互作用能,疏水相互作用能,正的靜電相互作用能,負的靜電相互作用能合并為5項;
2將與結合口袋中所有氨基酸的側鏈原子相關的相互作用能按人體20種不同氨基酸類型分別以范德華相互作用能,氫鍵相互作用能,疏水相互作用能,正的靜電相互作用能,負的靜電相互作用能共合并為100項;
3配體小分子原子與金屬的金屬-配體相互作用能合并為1項;
4配體小分子的可旋轉鍵數量為1項;
共107項相互作用能形成相互作用能矩陣;
所述利用打分函數模型進行親和力預測,具體包括:
1輸入靶點復合物中蛋白和小分子三維結構數據;
2對蛋白結構進行預處理;
3獲取蛋白活性中心口袋;
4生成107項相互作用能;
5調用打分函數模型并輸出給定復合物親和力預測值。
2.根據權利要求1所述一種基于相互作用能項和機器學習的蛋白-配體親和力預測方法,其特征在于,步驟1中,所述含配體小分子的蛋白配體復合物結晶體結構為:要求蛋白-配體的親和力類型為Kd或Ki,且所有復合物配體親和力值于皮摩爾級、納摩爾級、微摩爾級和毫摩爾級均有超過100個的分布。
3.根據權利要求1所述一種基于相互作用能項和機器學習的蛋白-配體親和力預測方法,其特征在于,步驟2中,所述通過PDBFixer軟件對所有蛋白進行預處理包括補齊缺失氨基酸殘基,補齊缺失原子,加氫。
4.根據權利要求1所述一種基于相互作用能項和機器學習的蛋白-配體親和力預測方法,其特征在于,步驟4中,所述計算找出每個蛋白配體小分子結合口袋附近的氨基酸殘基為:選定蛋白靶標PDB晶體結構自身配體周圍范圍內的殘基作為蛋白結合口袋中的氨基酸殘基。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華東師范大學,未經華東師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810735055.5/1.html,轉載請聲明來源鉆瓜專利網。





