[發明專利]一種基于深度學習的藥物互作規則預測方法有效
| 申請號: | 202010122995.4 | 申請日: | 2020-02-27 |
| 公開(公告)號: | CN111370073B | 公開(公告)日: | 2023-04-07 |
| 發明(設計)人: | 翁祖銓;鐘意;羅衡 | 申請(專利權)人: | 福州大學 |
| 主分類號: | G16C20/30 | 分類號: | G16C20/30;G06N3/0464;G06N3/048;G06N3/0475;G06N3/042;G06N3/084;G06N3/09 |
| 代理公司: | 福州元創專利商標代理有限公司 35100 | 代理人: | 陳明鑫;蔡學俊 |
| 地址: | 350108 福建省福州市*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 學習 藥物 規則 預測 方法 | ||
1.一種基于深度學習的藥物互作規則預測方法,該方法基于大數據的智能學習方法,通過學習藥物結構的特征來捕獲其與相互作用間的關系,其特征在于,包括如下步驟:
步驟S1、獲取到已知的藥物-藥物相互作用對及其相互作用規則的自然語言描述,建立藥物互作與互作規則間的藥物互作-互作規則類別標簽的數據集;
步驟S2、預處理輸入藥物對的分子結構SMILES,并分別將分子結構處理成矩陣作為共享網絡的輸入;
步驟S3、利用圖卷積層,注意力池化,全連接層,批歸一化,激活函數為ReLu,決策函數SoftMax和孿生網絡結構構建權重共享的圖卷積神經深度網絡GCNN;
步驟S4、將步驟S2中處理好的藥物對分子分別輸入到權重共享的GCNN中,通過若干輪的迭代訓練,獲得網絡模型的權重參數;
步驟S5、使用步驟S4中訓練好的GCNN模型,輸入需要預測的藥物對,待模型提取到藥物對的結構特征后,通過決策函數輸出藥物對所對應的相互作用規則類別;
所述步驟S3的GCNN的建立中,池化方式采用注意力池化的方法,包括三層圖卷積層以及三層全連接層,注意力池化定義為:
P=tanh(ATWB)
[aA]i=max1≤j≤LbPi,j及[aB]i=max1≤j≤LaPi,j
rA=P×softmax(aA)及rB=P×softmax(aB)
其中,A和B分別是藥物對中兩個藥物通過權重共享的GCNN所提取的特征矩陣,P是A,B矩陣間的作用的注意力對齊矩陣,aA和aB分別對P做行和列的最大池化,最后通過SoftMax函數得到藥物對間的注意力權重rA,rB;
所述步驟S4中GCNN訓練過程中,使用預處理好的訓練樣本作為輸入進行有監督的模型訓練,通過反向傳播更新權重,通過圖形處理器GPU進行模型推理,在模型過程中采用五倍交叉驗證幫助調整超參數及驗證模型穩定性;預處理好的測試樣本輸入網絡對網絡性能進行測試;模型優化的目標函數為多分類交叉熵,其定義為:
Li=-∑iti,jlog(pi,j)
其中,p為預測值,t為真實值,i為數據點,j為數據所屬的類別,L為損失值。
2.根據權利要求1所述的一種基于深度學習的藥物互作規則預測方法,其特征在于,所述步驟S1具體實現過程為:從現有的知識數據中提取藥物-藥物互作的對應的藥物分子名稱和結構以及其互作規則,將提取到的藥物互作規則分為141類作為藥物相互作用的訓練及預測標簽;同時建立藥物對-規則標簽的對應關系并構建數據集;數據集分為訓練集和測試集兩類。
3.根據權利要求1所述的一種基于深度學習的藥物互作規則預測方法,其特征在于,所述步驟S2具體實現過程為:共享網絡模型有兩個輸入,即藥物對,其中兩個輸入的形式是兩種藥物分子的分子線性輸入規范,即分子結構SMILES,共享網絡模型會自動對輸入的分子結構SMILES進行拓撲結構的提取,將其轉換成一個65×62的矩陣。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于福州大學,未經福州大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010122995.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:接口代碼自動同步方法、裝置及存儲介質
- 下一篇:頁面展示方法和設備





