[發(fā)明專利]分子特征的提取及三維定量構(gòu)效關(guān)系的計(jì)算方法及裝置在審
| 申請(qǐng)?zhí)枺?/td> | 202011025440.4 | 申請(qǐng)日: | 2020-09-25 |
| 公開(kāi)(公告)號(hào): | CN112185477A | 公開(kāi)(公告)日: | 2021-01-05 |
| 發(fā)明(設(shè)計(jì))人: | 賈伯陽(yáng) | 申請(qǐng)(專利權(quán))人: | 北京望石智慧科技有限公司 |
| 主分類號(hào): | G16C20/20 | 分類號(hào): | G16C20/20;G06F17/16;G06N3/04 |
| 代理公司: | 北京三聚陽(yáng)光知識(shí)產(chǎn)權(quán)代理有限公司 11250 | 代理人: | 李博洋 |
| 地址: | 100080 北京市海淀*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 分子 特征 提取 三維 定量 關(guān)系 計(jì)算方法 裝置 | ||
本發(fā)明公開(kāi)了一種分子特征的提取及三維定量構(gòu)效關(guān)系的計(jì)算方法及裝置,其中,該提取方法包括:獲取分子的第一特征矩陣;根據(jù)所述第一特征矩陣及預(yù)設(shè)圖卷積神經(jīng)網(wǎng)絡(luò)模型,生成分子第二特征矩陣;根據(jù)預(yù)設(shè)正方體像素模型及第二特征矩陣,生成第三特征矩陣;根據(jù)第三特征矩陣及預(yù)設(shè)三維圖卷積神經(jīng)網(wǎng)絡(luò)模型,生成第四特征矩陣;根據(jù)第三特征矩陣及第四特征矩陣,計(jì)算生成用以表征分子特征的第五特征矩陣;或據(jù)第四特征矩陣,計(jì)算生成用以表征分子特征的第五特征矩陣。通過(guò)實(shí)施本發(fā)明,解決了只能根據(jù)分子二維坐標(biāo)對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,導(dǎo)致提取出的分子特征較為片面的問(wèn)題,可以使用表征分子鍵的連接關(guān)系的三維圖結(jié)構(gòu)直接訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型。
技術(shù)領(lǐng)域
本發(fā)明涉及數(shù)據(jù)處理領(lǐng)域,具體涉及一種分子特征的提取及三維定量構(gòu)效關(guān)系的計(jì)算方法及裝置。
背景技術(shù)
定量構(gòu)效關(guān)系(QSAR),是使用某種數(shù)學(xué)模型來(lái)描述分子結(jié)構(gòu)與某種分子的生物活性之間的關(guān)系。QSAR的基本假設(shè)是分子的結(jié)構(gòu)信息包含了與其物理、化學(xué)及生物等性質(zhì)相關(guān)的信息,而再通過(guò)這些理化性質(zhì)進(jìn)而決定該化合物的生物活性。因此化合物的分子結(jié)構(gòu)信息與生物活性也有一定程度的相關(guān)。具體的,二維定量構(gòu)效關(guān)系(2D QSAR)有hansch方法、free-wilson方法。基于分子構(gòu)象的進(jìn)行QSAR預(yù)測(cè)的稱為三維定量構(gòu)效關(guān)系(下文稱3D-QSAR)。
現(xiàn)有技術(shù)中有根據(jù)分子化合物的smiles編碼及其原子坐標(biāo),確定分子化合物的QSAR的擬合值;也有將分子表達(dá)為圖結(jié)構(gòu),并經(jīng)由圖卷積神經(jīng)網(wǎng)絡(luò)(GCN)提取特征矩陣;但是上述方法只能根據(jù)大量的分子二維坐標(biāo)對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,導(dǎo)致提取出的分子特征表達(dá)分子的結(jié)構(gòu)信息較為片面。
發(fā)明內(nèi)容
因此,本發(fā)明要解決的技術(shù)問(wèn)題在于克服現(xiàn)有技術(shù)中的提取出的分子特征表達(dá)分子的結(jié)構(gòu)信息較為片面的缺陷,從而提供一種分子特征的提取及三維定量構(gòu)效關(guān)系的計(jì)算方法及裝置。
根據(jù)第一方面,本發(fā)明實(shí)施例提供了一種分子特征的提取方法,包括:獲取分子的第一特征矩陣,所述第一特征矩陣用以表征所述分子的初始特征維度以及原子數(shù)目;根據(jù)所述第一特征矩陣以及預(yù)設(shè)圖卷積神經(jīng)網(wǎng)絡(luò)模型,生成所述分子的第二特征矩陣;所述第二特征矩陣用以表征所述分子的第一特征維度以及原子數(shù)目;根據(jù)預(yù)設(shè)正方體像素模型以及所述第二特征矩陣,生成第三特征矩陣,所述第三特征矩陣用以表征所述分子中各原子在空間坐標(biāo)系的坐標(biāo)信息以及第一特征維度;根據(jù)所述第三特征矩陣以及預(yù)設(shè)三維圖卷積神經(jīng)網(wǎng)絡(luò)模型,生成第四特征矩陣,所述第四特征矩陣用以表征所述分子中各原子在空間坐標(biāo)系的坐標(biāo)信息以及第二特征維度;根據(jù)所述第三特征矩陣以及所述第四特征矩陣,計(jì)算生成用以表征所述分子特征的第五特征矩陣;或根據(jù)所述第四特征矩陣,計(jì)算生成用以表征所述分子特征的第五特征矩陣。
結(jié)合第一方面第一實(shí)施方式,在第一方面第一實(shí)施方式中,所述獲取分子的第一特征矩陣,具體包括:獲取分子中的多個(gè)原子及原子數(shù)目;根據(jù)預(yù)設(shè)編碼方式將各原子編碼,生成各原子對(duì)應(yīng)的編碼向量;根據(jù)各編碼向量,確定分子的初始特征維度;根據(jù)所述原子數(shù)目以及初始特征維度,確定所述分子的第一特征矩陣。
結(jié)合第一方面,在第一方面第二實(shí)施方式中,所述根據(jù)預(yù)設(shè)正方體像素模型以及所述第二特征矩陣,生成第三特征矩陣的步驟中,包括:將所述預(yù)設(shè)正方體像素模型劃分為多個(gè)三維像素;當(dāng)所述原子在所述三維像素的中心時(shí),將所述原子填充至所述三維像素,并確定所述原子在空間坐標(biāo)系的坐標(biāo)信息。
結(jié)合第一方面,在第一方面第三實(shí)施方式中,該方法還包括:根據(jù)第一維度參數(shù)確定所述第一特征維度,根據(jù)第二維度參數(shù)確定第二特征維度。
根據(jù)第二方面,本發(fā)明實(shí)施例提供了一種分子三維定量構(gòu)效關(guān)系的計(jì)算方法,包括:獲取分子的計(jì)算層次參數(shù);根據(jù)所述計(jì)算層次參數(shù)確定分子的目標(biāo)特征矩陣,所述目標(biāo)特征矩陣是通過(guò)多個(gè)計(jì)算單元生成的,所述計(jì)算單元用于執(zhí)行如第一方面或第一方面任一實(shí)施方式所述的分子特征的提取方法;根據(jù)預(yù)設(shè)的全聯(lián)接層函數(shù),將所述目標(biāo)特征矩陣轉(zhuǎn)換為一維特征矩陣;根據(jù)所述一維特征矩陣,計(jì)算生成所述分子的三維定量構(gòu)效關(guān)系值。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京望石智慧科技有限公司,未經(jīng)北京望石智慧科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011025440.4/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 上一篇:一種智能安防門
- 下一篇:一種冷凝式燃?xì)忮仩t
- 一種三維彩色物品制作方法
- 三維內(nèi)容顯示的方法、裝置和系統(tǒng)
- 三維對(duì)象搜索方法、裝置及系統(tǒng)
- 三維會(huì)話數(shù)據(jù)展示方法、裝置、存儲(chǔ)介質(zhì)和計(jì)算機(jī)設(shè)備
- 一種三維模型處理方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 用于基于分布式賬本技術(shù)的三維打印的去中心化供應(yīng)鏈
- 標(biāo)記數(shù)據(jù)的獲取方法及裝置、訓(xùn)練方法及裝置、醫(yī)療設(shè)備
- 一種基于5G網(wǎng)絡(luò)的光場(chǎng)三維浸入式體驗(yàn)信息傳輸方法及系統(tǒng)
- 用于機(jī)器人生產(chǎn)系統(tǒng)仿真的三維場(chǎng)景管理與文件存儲(chǔ)方法
- 基于三維形狀知識(shí)圖譜的三維模型檢索方法及裝置





