[發(fā)明專利]一種基于深層圖神經(jīng)網(wǎng)絡(luò)的分子表示方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 202211560221.5 | 申請日: | 2022-12-06 |
| 公開(公告)號: | CN116504333A | 公開(公告)日: | 2023-07-28 |
| 發(fā)明(設(shè)計(jì))人: | 魏驍勇;田奇;楊震群;曹溢;黃文禹;嚴(yán)麗巧 | 申請(專利權(quán))人: | 四川大學(xué) |
| 主分類號: | G16C20/70 | 分類號: | G16C20/70;G16C20/50;G06N3/0464;G06N3/08 |
| 代理公司: | 成都正煜知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 51312 | 代理人: | 袁宇霞 |
| 地址: | 610000 四*** | 國省代碼: | 四川;51 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 深層 神經(jīng)網(wǎng)絡(luò) 分子 表示 方法 系統(tǒng) | ||
1.一種基于深層圖神經(jīng)網(wǎng)絡(luò)的分子表示方法,其特征在于,包括如下步驟:
S1.調(diào)用第三方庫將分子的計(jì)算機(jī)存儲數(shù)據(jù)轉(zhuǎn)化為分子圖,分子圖包括鄰接矩陣、結(jié)點(diǎn)和邊,其中,調(diào)用第三方庫包括RDKit;
S2.分析分子圖得到分子圖的結(jié)點(diǎn)和邊的初始特征向量;
S3.基于圖神經(jīng)網(wǎng)絡(luò)和鄰接矩陣對結(jié)點(diǎn)和邊的初始特征向量進(jìn)行密集殘差圖卷積運(yùn)算,得到新的結(jié)點(diǎn)和邊的特征向量;
S4.對新的結(jié)點(diǎn)和邊的特征向量進(jìn)行池化操作,得到分子表示。
2.根據(jù)權(quán)利要求1所述的一種基于深層圖神經(jīng)網(wǎng)絡(luò)的分子表示方法,其特征在于:所述步驟S1的具體步驟為:
S1.1.獲取分子的計(jì)算機(jī)存儲數(shù)據(jù),其中,計(jì)算機(jī)存儲數(shù)據(jù)是以“.MOL”、“.SDF”、“.KCF”為后綴存儲起來的分子的文本文件,或一串基于SMILES表示法的分子字符串;
S1.2.若計(jì)算機(jī)存儲數(shù)據(jù)為以“.MOL”、“.SDF”、“.KCF”后綴存儲起來的分子的文本文件,轉(zhuǎn)到步驟S1.3,若計(jì)算機(jī)存儲數(shù)據(jù)為以SMILES表示法存儲起來的分子的文本文件,轉(zhuǎn)到步驟S1.4,否則,跳過;
S1.3.初始化一個(gè)空的分子類,并采用開源工具包rdkit中的函數(shù)從上到下逐行掃描分子的文本文件,在分子類中依次讀入原子信息和化學(xué)鍵信息,將原子信息和化學(xué)鍵信息分別存儲進(jìn)分子類中的結(jié)點(diǎn)和邊,得到一個(gè)存儲了結(jié)點(diǎn)和邊的分子類,其中,原子信息包括原子位置、原子描述符、化學(xué)鍵類型和作為結(jié)點(diǎn)唯一標(biāo)識的原子ID,化學(xué)鍵信息以原子IDi-原子IDj關(guān)系對記錄,i表示第i個(gè)原子,j表示第j個(gè)原子,且i≠j,化學(xué)鍵類型包括以“-”表示的單鍵,“=”表示的雙鍵,“#”表示的三鍵,“:”表示的芳香鍵,“*”代表的其他鍵,原子描述符包括“C”、“H”、“0”;
S1.4.初始化一個(gè)空的分子類,采用開源工具包rdkit中的函數(shù)分析存儲的一維序列分子字符串的字符中的原子、原子的邊類型、支鏈結(jié)構(gòu)和環(huán)結(jié)構(gòu),并基于原子、原子的邊類型、支鏈結(jié)構(gòu)和環(huán)結(jié)構(gòu)得到原子信息和化學(xué)鍵信息,將原子信息和化學(xué)鍵信息分別存儲進(jìn)分子類中的結(jié)點(diǎn)和邊,得到一個(gè)存儲了結(jié)點(diǎn)和邊的分子類,其中,一個(gè)結(jié)點(diǎn)存儲一個(gè)原子信息,一個(gè)邊存儲一個(gè)化學(xué)鍵信息,一維序列分子字符串包含以英文字母元素符號表示的原子,“-”表示的單鍵,“=”表示的雙鍵,“#”表示的三鍵,“:”表示的芳香鍵,“()”內(nèi)表示碳鏈分支和環(huán)的斷開處用數(shù)字標(biāo)記,分子類中原子信息包括原子位置、原子描述符、化學(xué)鍵類型和作為結(jié)點(diǎn)唯一標(biāo)識的原子ID,化學(xué)鍵信息以原子IDi-原子IDj關(guān)系對記錄,i表示第i個(gè)原子,j表示第j個(gè)原子,且i≠j,化學(xué)鍵類型包括以“-”表示的單鍵,“=”表示的雙鍵,“#”表示的三鍵,“:”表示的芳香鍵,“*”代表的其他鍵,原子描述符包括“C”、“H”、“0”、“N”、“S”、“P”、“Cl”、“Si”,氫原子“H”、單鍵和芳香鍵在SMILES和分子類中省略或保留;
S1.5.初始化一個(gè)分子圖類以及一個(gè)行和列都為結(jié)點(diǎn)數(shù)大小的零矩陣,行列索引步驟S1.3或步驟S1.4得到的分子類中對應(yīng)的原子ID,根據(jù)原子IDi-原子IDj關(guān)系對,在零矩陣中對應(yīng)的位置填入1,得到基于無向圖的鄰接矩陣A,鄰接矩陣蘊(yùn)含了分子圖的拓?fù)浣Y(jié)構(gòu),將分子類中存儲了原子信息的結(jié)點(diǎn)和存儲了化學(xué)鍵信息的邊,與鄰接矩陣一同存儲進(jìn)分子圖類作為屬性,得到一個(gè)存儲了結(jié)點(diǎn)、邊、鄰接矩陣的分子圖類,即分子圖。
3.根據(jù)權(quán)利要求2所述的一種基于深層圖神經(jīng)網(wǎng)絡(luò)的分子表示方法,其特征在于:所述步驟S2的具體步驟為:
步驟S2.1:根據(jù)分子圖中原子在元素周期表中的原子序號,為每個(gè)存儲了原子信息的結(jié)點(diǎn)構(gòu)造一個(gè)118維為長度的one-hot向量,得到的向量作為結(jié)點(diǎn)的初始向量,存儲在分子圖中,其中,118維基于最大原子序數(shù)確定的;
步驟S2.2:傳入步驟S2.1得到的分子圖,初始化一個(gè)長度為5的列表:[0:單鍵,1:雙鍵,2:三鍵,3:芳香鍵,4:其他],初始化一個(gè)5維的零向量,根據(jù)化學(xué)鍵類型的對應(yīng)數(shù)字,在對應(yīng)位置賦值為1,得到一個(gè)5維的one-hot向量,并將得到的向量作為邊的初始特征向量,存入分子圖中。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于四川大學(xué),未經(jīng)四川大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211560221.5/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:雙軸承繞線輪
- 下一篇:一種對甘蔗渣進(jìn)行快速炭化的方法
- 硬件神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法、計(jì)算裝置、軟硬件協(xié)作系統(tǒng)
- 生成較大神經(jīng)網(wǎng)絡(luò)
- 神經(jīng)網(wǎng)絡(luò)的生成方法、生成裝置和電子設(shè)備
- 一種舌診方法、裝置、計(jì)算設(shè)備及計(jì)算機(jī)存儲介質(zhì)
- 學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
- 脈沖神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法及相關(guān)轉(zhuǎn)換芯片
- 圖像處理方法、裝置、可讀存儲介質(zhì)和計(jì)算機(jī)設(shè)備
- 一種適應(yīng)目標(biāo)數(shù)據(jù)集的網(wǎng)絡(luò)模型微調(diào)方法、系統(tǒng)、終端和存儲介質(zhì)
- 用于重構(gòu)人工神經(jīng)網(wǎng)絡(luò)的處理器及其操作方法、電氣設(shè)備
- 一種圖像神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化方法及裝置





