[發明專利]基于注意力機制的圖分類方法及化合物毒性預測方法有效
| 申請號: | 202011637474.9 | 申請日: | 2020-12-31 |
| 公開(公告)號: | CN112733918B | 公開(公告)日: | 2023-08-29 |
| 發明(設計)人: | 高建良;高俊 | 申請(專利權)人: | 中南大學;賽爾網絡有限公司 |
| 主分類號: | G06F18/241 | 分類號: | G06F18/241;G06N3/042;G06N3/0499;G06N3/082 |
| 代理公司: | 長沙永星專利商標事務所(普通合伙) 43001 | 代理人: | 周詠;米中業 |
| 地址: | 410083 湖南*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 注意力 機制 分類 方法 化合物 毒性 預測 | ||
1.一種化合物毒性預測方法,具體包括如下步驟:
A.將化合物分子表示為原始圖:節點對應于原子,邊對應于原子對之間存在的化學鍵;
B.根據步驟A獲取的原始圖網絡及數據信息,初始化節點的特征嵌入、構建高階圖網絡并初始化高階圖網絡中的節點嵌入;
在具體實施時,采用如下步驟初始化節點的特征嵌入:
對于給定的圖網絡G,用V(G)表示圖G的節點集,E(G)表示圖G的邊集;節點i∈V(G)和邊(i,j)∈E(G)都具有屬性;將節點i∈V(G)的屬性編碼為ui的嵌入特征,N(i)={j|(i,j)∈E(G)}表示節點i的鄰居節點,|N(i)|表示節點i的鄰居節點個數;使用節點的標簽和屬性初始化節點嵌入:對于節點i∈V(G),通過分別連接基于節點的標簽和屬性,并生成的兩個單熱向量和來初始化嵌入ui,其中d=d1+d2,||為連接符號;
采用如下步驟構建高階圖網絡:
對于給定的整數k≥2,將給定的一階化合物分子圖網絡G中構成連通子圖的任意k個不同節點表示為Ck={v1,v2,...,vk};然后,將Ck表示為k階化合物分子圖網絡中的一個節點;所有Ck組成k階化合物分子圖網絡的節點集并記為V(G)k;定義k階化合物分子圖網絡的節點Ck的鄰域為N(Ck)={Tk∈V(G)k|(|Ck∩Tk|)=k-1},其中|Ck∩Tk|為與Ck和Tk相交的節點數;若Tk為Ck的鄰居,則有一條邊(Ck,Tk)存在于Ck和Tk之間,且令所有這些邊組成k階化合物分子圖網絡的邊集并記為E(G)k,k階圖網絡Gk表示為(V(G)k,E(G)k);從而構造一個k階化合物分子圖網絡,其中每個節點代表一個k階子結構;
采用如下步驟初始化節點嵌入:
對于k階化合物分子圖網絡中的節點Ck,采用k-1階化合物分子圖網絡的特征嵌入作為初始特征u(Ck):其中u(Ck)表示k階化合物分子圖網絡中節點Ck的初始特征,u(Ck-1)表示Ck-1在k-1階圖網絡中的特征;對于Ck,有k-1個節點組成連通子圖的組合是Ck的子集;N為子結構的個數;k為正整數且k≥2;
C.各階化合物分子圖網絡中的節點,采用子結構交互注意力網絡SIA,捕獲吸收鄰居節點信息,捕獲吸收鄰居節點間的交互信息,并訓練得到化合物分子圖網絡中每個節點的新的特征嵌入;
具體實施時,采用如下步驟進行捕獲吸收:
設定k階化合物分子圖網絡中的每個節點Ck為一個k階子結構,并被賦予一個基本子結構侵入向量u(Ck)∈Rd,其中d表示特征維數;化合物分子相鄰子結構聚合用于融合相鄰子結構信息,中心子結構a將相鄰子結構b,c,d,e,f的信息聚集于本身;相鄰子結構聚合的迭代公式如下式所示:
式中Tk∈N(Ck)為節點Ck在k階化合物分子圖網絡中的鄰居;W1∈Rd'×d為每個節點的共享權值矩陣,d'為每個節點的輸出維數;α(Ck,Tk)為注意系數,且計算公式為
其中f(u(Ck),u(Tk))為表示u(Ck)和u(Tk)的相容性的標量,通過單隱層前饋網絡并采用如下公式計算
a∈Rr為生成標量值的權值向量,tanh為激活函數,W2∈Rr×2d為權值矩陣,表示u(Ck)和u(Tk)的連接,b∈Rr為偏置,r為常數且表示隱含層的維數;
采用如下步驟進行捕獲吸收:
聚合化合物分子圖中相鄰子結構的相互作用信息,中心子結構a將相鄰子結構c、d的交互信息以及b、f間的交互信息聚集于本身;迭代公式如下式:
式中u(Ck)'ia為節點Ck的鄰居交互表示,u(Tk)為節點Tk的表示,u(Sk)為節點Sk的表示,⊙為哈瑪達積;β(Tk,Sk)為節點Tk和Sk之間的交互作用系數,且計算公式為
采用如下算式進行歸一化:
式中(Mk,Qk)為k階化合物分子圖中的一條邊,且滿足Mk和Qk均為Ck的鄰居,E(G)k為k階化合物分子圖網絡的邊集;
采用如下步驟獲取新的特征嵌入:
融合鄰居節點信息和鄰居節點間的交互信息,獲得節點嵌入u(Ck);節點嵌入u(Ck)的迭代表示式為u(Ck)'=σ(αu(Ck)'sa+(1-α)u(Ck)'ia),其中u(Ck)'sa為鄰居聚合得到的新節點嵌入,u(Ck)'ia為鄰居相互作用聚合得到的新節點嵌入,σ為sigmoid激活函數;
D.采用節點注意力網絡SNA將圖網絡中的節點特征嵌入融合成化合物分子圖網絡嵌入,并級聯各階圖網絡嵌入,再通過多層感知機將級聯后的圖網絡嵌入進行降維分類,從而得到最終的圖網絡分類結果;
具體實施時,采用如下步驟獲取圖網絡嵌入:
利用注意機制學習每個化合物分子圖網絡子結構a,b,c,d,e,f的權值Score(a),Score(b),...,Score(f),然后通過學習子結構的權值將子結構嵌入融合為化合物分子圖網絡嵌入;設定S(G)為化合物分子圖網絡G中子結構的集合,S(G)∈RN×d表示對應子結構嵌入的集合,N為子結構的個數,un∈R1×d表示子結構n∈S(G)的嵌入,然后通過如下算式計算得到圖級嵌入hG:
式中σ為激活函數且為un的轉置;ReLU為激活函數;W3∈Rd×d為子結構嵌入的可學習權矩陣;
采用如下步驟獲取最終的圖網絡分類結果:
對于k階化合物分子圖網絡對應的圖網絡的嵌入將各階化合物分子圖網絡對應的化合物分子圖網絡嵌入按遞增順序級聯,得到最終的高階化合物分子圖網絡嵌入然后將生成的化合物分子圖網絡嵌入FG輸入至多層感知機MLP層,從而得到最終的預測化合物分子圖網絡標簽
E.得到的最終的化合物分子所對應的圖的分類結果,對應于最終的化合物毒性預測結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中南大學;賽爾網絡有限公司,未經中南大學;賽爾網絡有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011637474.9/1.html,轉載請聲明來源鉆瓜專利網。





