[發明專利]基于相互作用能項和機器學習的蛋白-配體親和力預測方法有效
| 申請號: | 201810735055.5 | 申請日: | 2018-07-06 |
| 公開(公告)號: | CN109036580B | 公開(公告)日: | 2021-08-20 |
| 發明(設計)人: | 季長鴿;王衛軍;張增輝;閆玉娜;段觀福;單金文 | 申請(專利權)人: | 華東師范大學 |
| 主分類號: | G16H70/40 | 分類號: | G16H70/40 |
| 代理公司: | 上海藍迪專利商標事務所(普通合伙) 31215 | 代理人: | 徐筱梅;張翔 |
| 地址: | 200241 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 相互作用 機器 學習 蛋白 親和力 預測 方法 | ||
本發明涉及一種基于相互作用能項和機器學習的蛋白?配體親和力預測方法,該方法通過分散配體與蛋白口袋的各種相互作用能項到20種氨基酸殘基的主側鏈上,并用機器學習的方法對PDB庫中已知活性的蛋白?配體相互作用能信息進行訓練得到模型,利用所得模型進行配體與蛋白親和力打分。本發明通過分散相互作用能項,可以充分考慮不同氨基酸殘基主側鏈對親和力的影響;利用機器學習進行非線性擬合,有利于處理各個相互作用能之間的關聯或耦合作用,從而針對性的減少不同氨基酸結構在親和力計算過程中帶來的誤差。利用本發明,更有利于活性分子親和力的預測,以達到提高預測準確度的目的。
技術領域
本發明涉及打分函數技術領域,尤其涉及一種基于配體與蛋白結合口袋殘基相互作用能和機器學習的蛋白質-配體親和力預測方法。
背景技術
在藥物設計過程中,打分函數通常用于蛋白質靶標與其配體之間的結合親和力的預測,從而提高藥物設計的成功率和降低藥物篩選的成本。近年來,越來越受到相關科研機構和制藥公司的重視。常用的打分函數方法可以分為基于力場的打分函數,基于經驗的打分函數和基于知識的打分函數。常用打分函數有PLP,ChemScore,X-Score,和GlideScore等。其中,基于經驗的打分函數應用最為廣泛。基于經驗的打分函數通常是由蛋白質和配體多種物理化學相互作用項組成,如范德華、氫鍵、靜電以及金屬-配體相互作用能等。這些項往往通過線性擬合得到相關系數。然而,目前基于經驗的打分函數仍然存在如預測值與實驗值相關性不佳、靶點依賴性大和對同系物敏感性差等相關問題。而導致這些問題的原因很多,比如相互作用能項過少導致差異化一定程度被忽略,蛋白配體復合物數據集很少導致多樣性不夠,線性回歸忽略了各相互作用能項間的耦合作用。
機器學習已經被廣泛的應用于藥物設計的各個領域,包括靶標預測、毒性預測、藥物相似性預測、藥物活性預測等。常用的機器學習方法包括支持向量機、隨機森林和人工神經網絡等。
因此,利用機器學習發展新的預測蛋白-配體親和力的打分函數新方法,在基于結構的藥物設計和藥物創新發展中有著至關重要的作用。
發明內容
本發明的目的在于提供一種基于氨基酸殘基相互作用能項和機器學習的蛋白-配體親和力預測方法,以彌補現有技術的不足。
實現本發明目的的具體技術方案是:
一種基于相互作用能項和機器學習的蛋白-配體親和力預測方法,該方法包括以下具體步驟:
步驟1:從PDBbind數據庫或RCSB-PDB數據庫中得到含配體小分子的蛋白配體復合物結晶體結構,并從PDBbind數據庫或文獻中得到并提取親和力的活性數據;其中,所述含配體小分子的蛋白配體復合物結晶體結構為:要求配體的親和力類型為Kd或Ki,且所有復合物配體親和力值于皮摩爾級、納摩爾級、微摩爾級和毫摩爾級均有超過100個的分布;
步驟2:通過PDBFixer軟件對所有蛋白進行預處理,其包括補齊缺失氨基酸殘基,補齊缺失原子,加氫;
步驟3:基于amber99SB力場獲取蛋白原子電荷;
步驟4:計算找出每個蛋白配體小分子結合口袋附近的氨基酸殘基,具體為:選定蛋白靶標 PDB晶體結構自身配體周圍范圍內的殘基作為蛋白結合口袋中的氨基酸殘基;
步驟5:計算每個配體小分子的每個原子與蛋白結合口袋中的氨基酸殘基每個原子的相互作用能,具體為:計算每個配體小分子的每個原子與氨基酸殘基每個原子的范德華、氫鍵、疏水、靜電的相互作用能和金屬-配體相互作用能,以及配體自身的可旋轉鍵數量;其具體定義如下:
1范德華相互作用能為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華東師范大學,未經華東師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810735055.5/2.html,轉載請聲明來源鉆瓜專利網。





