[發明專利]一種基于高效圖卷積的藥物靶標交互預測方法研究在審
| 申請號: | 202111344728.2 | 申請日: | 2021-11-12 |
| 公開(公告)號: | CN114023377A | 公開(公告)日: | 2022-02-08 |
| 發明(設計)人: | 王貴參;王紅梅;杜夢妍;郭放 | 申請(專利權)人: | 長春工業大學 |
| 主分類號: | G16B15/30 | 分類號: | G16B15/30;G16B40/00;G06N3/04;G06N3/08 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 130000 吉林省長春*** | 國省代碼: | 吉林;22 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 高效 圖卷 藥物 靶標 交互 預測 方法 研究 | ||
本發明公開了基于高效圖卷積的藥物靶標交互預測方法,該方法的目的是為預測藥物靶標對之間是否會相互作用,該模型的主要步驟是:節點特征處理,圖結構處理,定義模型,訓練模型,評估模型。快速、準確地發現能夠有效治療疾病的藥物對社會的發展非常重要,但由于目前藥物靶標預測的模型存在內存消耗大和推理延遲較高的問題,因此其訓練和部署仍然很困難。基于以上考慮,本發明提出了基于高效圖卷積的藥物靶標相互預測方法,顯著的改善了圖神經網絡識別藥物靶標對相互作用時的內存消耗和延遲。
技術領域
本發明是屬于藥物靶標相互作用預測領域,是一種基于高效圖卷積預測藥物靶標相互作用的方法。
背景技術
如今已知數以萬計的疾病在威脅人類的健康,并且每年都在增加新的疾病,因此快速、準確地發現能夠有效治療疾病的藥物對社會的發展非常重要。藥物—靶標預測就是通過識別藥物化合物與蛋白質靶點之間的相互作用,識別針對新的藥物和蛋白質靶點的新配體,如此可以大大減少實驗成本和時間。傳統的藥物靶標相互作用預測方法大體分為兩大類:一是基于分子對接方法,二是基于配體方法。這些方法存在明顯不足之處,比如基于分子對接方法依賴于目標蛋白的三維結構,現實情況有些靶蛋白的三維結構難以獲得,當沒有辦法獲得靶蛋白的三維結構時這種方法也就無法起作用。基于配體的方法在藥物靶標相互作用預測中通常是有效的,但當已知配體數據不夠時,預測結果也可能不那么可靠。如今常用的化學基因組學方法來預測藥物靶標相互作用有多種形式,如基于機器學習的方法和基于圖的方法。近年來,人們致力于研究基于機器學習的方法,這些方法基于一個核心觀點即假設相似藥物作用于相似靶點。在過去的幾年里,在藥物靶標相互作用網絡上執行的方法在預測新的藥物靶標相互作用上顯示了很好的結果。如DTI-ARMA、DTI-CDF、DTI-TAG等方法。然而,圖神經網絡(GNNs)的內存消耗和推理延遲較高,因此其訓練和部署仍然很困難。高效圖卷積是一種新型的GNN架構,具有較低的內存消耗和延遲,以及適合加速實現的特性。
發明內容
針對藥物和蛋白質異構交互圖中存在的不足以及GNN模型中內存消耗過大的缺點,本發明的目的是提供一種更加準確,高效低耗的預測方法。
本發明提供一種基于EGC模型的藥物靶標交互預測方法,所述方法步驟如下:
步驟S1:節點特征處理
根據4種藥物矩陣和3種蛋白質矩陣,通過隨機游走和主成分分析模型,獲得蛋白質和藥物特征矩陣。
步驟S2:邊處理
根據藥物和蛋白質交互的鄰接矩陣,將蛋白質交互圖處理成邊圖,并根據新的邊圖生成藥物靶標對特征矩陣。
步驟S3: 定義模型
定義模型結構,設置訓練參數。
步驟S4:訓練模型
將正向邊和負向邊劃分訓練集,驗證集和測試集,并輸入到模型中進行訓練。
步驟S5:評估模型
根據訓練結果求得損失,并每100輪輸出roc和pr的信息。
附圖說明
圖1為本發明的流程圖;
圖2為本發明與其他算法的ROC對比圖;
圖3為本發明與其他算法的PR對比圖。
具體實施方式
以下實施例用于說明本發明,但不用來限制本發明的范圍。現通過附圖和實施例對本發明作進一步的詳細描述。
圖1為本發明實施例提供基于高效圖卷積的藥物靶標交互預測模型流程示意圖。如圖1所示,本實施例主要包含以下步驟:
步驟S1:節點特征處理
根據4種藥物交互矩陣和3種蛋白質交互矩陣,首先通過杰卡德相似系數聚合多種藥物和蛋白質信息,然后通過隨機游走模型獲得藥物和蛋白質特征矩陣,最后通過主成分分析模型對高維度矩陣進行降維,最終獲得125維的藥物和蛋白質特征。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于長春工業大學,未經長春工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111344728.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種計算機數據采集裝置
- 下一篇:一種用于污水深度處理一體化設備





