[發明專利]一種基于深度學習的蛋白質藥物結合位點預測方法在審
| 申請號: | 201910839108.2 | 申請日: | 2019-09-05 |
| 公開(公告)號: | CN111435608A | 公開(公告)日: | 2020-07-21 |
| 發明(設計)人: | 魏志強;李臻;江明建;張樹剛;孟美 | 申請(專利權)人: | 中國海洋大學;青島海洋科學與技術國家實驗室發展中心 |
| 主分類號: | G16B20/30 | 分類號: | G16B20/30 |
| 代理公司: | 蘇州國卓知識產權代理有限公司 32331 | 代理人: | 陸曉鷹 |
| 地址: | 266100 山*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 學習 蛋白質 藥物 結合 預測 方法 | ||
本發明提出了一種基于深度學習的蛋白質藥物結合位點預測方法,包括如下步驟:步驟1、選取蛋白數據庫中的若干蛋白質形成訓練集,若干蛋白質形成驗證集,若干蛋白質形成測試集,其中訓練集用于訓練模型的訓練;步驟2、訓練后的訓練模型對蛋白質數據庫進行特征提取和標簽提取,獲取數據,完成神經網絡的訓練,得到預測模型;步驟3、將新的蛋白質輸入預測模型中,進行結合位點位置的定位和預測,借此,本發明具有綜合考慮結合位點形成因素,基于深度學習進行結合位點的定位和預測的優點。
技術領域
本發明屬于結合位點預測方法領域,特別涉及一種基于深度學習的蛋白質藥物結合位點預測方法。
背景技術
目前,隨著新型疾病的出現以及病毒、細菌等病原體耐藥性的提高,藥物的研發面臨著巨大的壓力。藥物的研發需要經歷先導化合物的發現、臨床試驗、上市以及追蹤等多個過程,需要耗費大量的人力、物力、財力以及時間。計算機輔助藥物設計的出現一定程度上解決了部分問題,計算機輔助藥物設計通過使用計算機模擬藥物的代謝、篩選等過程,為藥物研發提供幫助。在計算機輔助藥物設計中,虛擬篩選是關鍵的步驟,其通過篩選能與靶點蛋白相結合的小分子化合物,為先導化合物的發現奠定基礎。而結合位點的預測,是通過發現和預測靶點蛋白上與小分子結合的口袋,在虛擬篩選中具有重要的指導作用。
結合位點(Binding Sites),也稱為口袋(Pockets),是蛋白質表面的空腔,是能與小分子化合物結合的作用位點。結合位點的定位,能為分子對接時的結合構象提供重要的指導作用,減少對接構象空間搜索區間,從而減少對接和虛擬篩選的時間。
結合位點的篩選,主要通過影響結合位點形成的幾個關鍵因素來預測。蛋白質的幾何結構是形成結合位點的一個重要因素,其表面的空腔往往是結合位點形成的絕佳區域。通過查找蛋白質的空腔或者是凹陷部位來尋找蛋白質的結合位點稱為基于幾何結構的方法(geometry-based method)。LIGSITECSC和LIGSITE通過將蛋白質離散為的網格,繼而尋找那些符合特殊幾何結構(protein-solvent-protein和surfacesolvent-surface)的網格點。而surfnet則是通過在蛋白質和小分子的原子對之間填充圓圈來發現所謂的表面缺口,也就是空腔。fpocket算法同樣利用圓球,不同的是,其利用維諾劃分算法過濾出在閾值范圍內的球體,即那些蛋白質表面的空腔。bSiteFinder方法通過尋找與目標蛋白質三維結構相似并且已知結合位點的蛋白質作為模板,并對這些蛋白質的結合位點信息進行聚類等分析,以此得到目標蛋白質的結合位點。
非鍵相互作用(Non-bonded Interactions)也是影響結合位點形成的重要因素,比如范德華力、氫鍵等,這類方法也成為基于能量的方法。基于能量的方法大多采用基團探針來不斷計算各個位置與蛋白質的能量值,進而通過找出那些潛在的能量特異點來探索結合位點。Q-SiteFinder方法用-CH3探針來計算蛋白質網格的非鍵相互作用,并采用聚類算法對最終的能量分布進行聚類,預測出潛在的口袋。
蛋白質的殘基序列中包含了豐富的遺傳信息,而殘基序列也是決定蛋白質功能的關鍵因素。通過挖掘蛋白質殘基序列中所蘊含的信息來尋找結合位點稱為基于序列的方法。該類方法只對蛋白質的殘基序列進行分析,尋找具有結合活性的殘基,其往往需要借助序列分析中的方法或者工具來協助分析。OSML方法便是對蛋白質序列提取PSSM(positionspecific scoring matrix)并構建SVM模型,其創新之處在于其構建模型的數據是根據輸入的不同動態改變,也就是其所謂的Query-Driven Dynamic。
隨著機器學習尤其是深度學習在圖形領域的廣泛應用,其在藥物設計領域也成為了研究的熱點。比如DeepSite,該方法根據原子類型構建蛋白質三維結構的8通道特征作為輸入,進行卷積神經網絡的訓練,最終預測口袋的位置。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國海洋大學;青島海洋科學與技術國家實驗室發展中心,未經中國海洋大學;青島海洋科學與技術國家實驗室發展中心許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910839108.2/2.html,轉載請聲明來源鉆瓜專利網。





