[發明專利]基于單獨注意力機制的預測化合物蛋白質親和力方法、計算機設備、存儲介質在審
| 申請號: | 202011513485.6 | 申請日: | 2020-12-18 |
| 公開(公告)號: | CN112542211A | 公開(公告)日: | 2021-03-23 |
| 發明(設計)人: | 王淑棟;劉嘉麗;宋弢;鐘悅 | 申請(專利權)人: | 中國石油大學(華東) |
| 主分類號: | G16B5/00 | 分類號: | G16B5/00;G16B40/00;G16C20/30;G06N3/04;G06N3/08 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 266580 山*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 單獨 注意力 機制 預測 化合物 蛋白質 親和力 方法 計算機 設備 存儲 介質 | ||
本發明公開了一種基于單獨注意力機制的預測化合物蛋白質親和力方法。所述方法包括雙向門控循環單元(BiGRU)模型和卷積神經網絡(CNN)模型,整個網絡架構為BiGRU/BiGRU?CNN,其中BiGRU/BiGRU模型中加入了單獨注意力機制(Separate_Attention)。所述的雙向門控循環單元模型包括兩個門控循環單元(GRU)組成的序列處理模型,一個輸入是向前輸入,另一個輸入是反向輸入,是一個只有輸入門和忘記門雙向遞歸神經網絡。模型的輸入為化合物序列與蛋白質序列,二者輸入到BiGRU/BiGRU模型里。其中化合物序列表示為加入化合物分子理化性質的SMILES字符串稱為SMILES#,蛋白質序列表示由蛋白質的結構屬性編碼而成。BiGRU/BiGRU輸出為經過單獨的注意力模型表示的化合物特征向量和蛋白質特征向量。所述的CNN模型由卷積層、池化層、全連接層組成,該模型的輸入為化合物特征向量、蛋白質特征向量;該BiGRU/BiGRU?CNN模型的最終輸出為預測化合物蛋白質親和力值的根均方誤差值。
技術領域
本發明涉及化合物蛋白質分子結構與性質領域,具體涉及一種基于單獨注意力機制的預測化合物蛋白質親和力方法、計算機設備、存儲介質。
背景技術
識別化合物和蛋白質之間的相互作用對發現和開發安全有效的藥物具有重要意義。揭示未知的化合物蛋白質相互作用(CPI)有助于預測潛在的副作用,并發現現有藥物的新用途,如藥物重定位。單純依靠傳統實驗識別CPI既費時又昂貴,因此基于臨床試驗已經測量到的相互作用,使用統計和機器學習的模型來預測化合物蛋白質相互作用強度是一個重要的替代方法。如從化學基因組學角度開發出的機器學習預測方法,該方法將化學空間、基因組空間及其相互作用考慮到統一的框架內。
深度學習的引入被證明是預測藥物靶點結合親和力的最佳模型之一。深度學習的主要優點是通過在每一層中進行非線性轉換,它們能夠更好的表示原始數據進而便于學習數據中隱藏的模式。然而很多模型的化合物表示僅僅是分子指紋、單一的SMILES字符串。這樣會使編碼的化合物特征表示丟失許多化合物原有的重要信息,造成最終預測化合物蛋白質親和力值的不準確性。
發明內容
本發明的目的是為了解決上述化合物分子重要信息丟失并提高預測準確率等問題,本發明實施例提供了一種基于單獨注意力機制的預測化合物蛋白質親和力方法、計算機設備、存儲介質,能夠將化合物分子的結構性質編碼到SMILES字符串中,從而可以提取到更多關于化合物分子的信息,并且在化合物蛋白質特征表示過程中分別加入注意力模型即單獨注意力機制使得獲取更精確的特征表示向量,并且使用深度學習方法提高預測化合物蛋白質親和力值的準確率。
根據本發明實施例的第一方面,提供了基于單獨注意力機制的預測化合物蛋白質親和力方法。
在一些可選實施例中,所述方法包括雙向門控循環單元(BiGRU)模型和卷積神經網絡(CNN)模型,整個網絡架構為BiGRU/BiGRU-CNN,其中BiGRU/BiGRU模型中加入了單獨注意力機制(Separate_Attention)。所述的雙向門控循環單元模型包括兩個門控循環單元(GRU)組成的序列處理模型,一個輸入是向前輸入,另一個輸入是反向輸入,是一個只有輸入門和忘記門雙向遞歸神經網絡。模型的輸入為化合物序列與蛋白質序列,二者輸入到BiGRU/BiGRU模型里。其中化合物序列表示為加入化合物分子理化性質的SMILES字符串稱為SMILES#,蛋白質序列表示由蛋白質的結構屬性編碼而成。BiGRU/BiGRU輸出為經過單獨的注意力模型表示的化合物特征向量和蛋白質特征向量。所述的CNN模型由卷積層、池化層、全連接層組成,該模型的輸入為化合物特征向量、蛋白質特征向量;該BiGRU/BiGRU-CNN模型的最終輸出為預測化合物蛋白質親和力值的根均方誤差值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國石油大學(華東),未經中國石油大學(華東)許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011513485.6/2.html,轉載請聲明來源鉆瓜專利網。





