[發明專利]一種基于人工神經網絡的分子屬性預測方法有效
| 申請號: | 201811258268.X | 申請日: | 2018-10-26 |
| 公開(公告)號: | CN109461475B | 公開(公告)日: | 2022-05-13 |
| 發明(設計)人: | 劉淇;陳恩紅;陸承鏹;王超;黃振亞 | 申請(專利權)人: | 中國科學技術大學 |
| 主分類號: | G16C20/30 | 分類號: | G16C20/30;G16C20/40;G16C20/50;G06N3/04 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 張雪嬌;趙青朵 |
| 地址: | 230026 安*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 人工 神經網絡 分子 屬性 預測 方法 | ||
本發明提供了一種基于人工神經網絡的分子屬性預測方法,包括:S1)對分子數據進行預處理:通過圖的數據結構表征的方法,得到原子空間表征與原子構成表征;S2)建立模型:將原子空間表征與原子構成表征通過多層卷積神經網絡,得到分子各級的表征,并將分子各級的表征進行組合,得到模型;S3)根據模型預測分子屬性。與現有技術相比,本發明利用多層級卷積神經網絡,能夠利用已有數據的信息以及分子的多層級結構,從中學出分子屬性和空間構成的關系,并用來預測未知分子的相關屬性,因此具有較好的速度與精度。
技術領域
本發明屬于材料學技術領域,尤其涉及一種基于人工神經網絡的分子屬性預測方法。
背景技術
從藥物研發,到材料開發,都離不開分子發現。為了尋找到具有特定屬性的分子來滿足應用上的需求,通用的方法是遍歷一個未知的可能分子的集合(稱之為化學空間),在遍歷過程中,研究人員通過各種方法來預測分子的屬性,如果發現某分子符合要求,則記錄下來做進一步研究。舉例而言,對分子能量屬性的預測能夠幫助研究人員找到穩定的分子。
但是,化學空間往往非常龐大,一個被廣泛應用的化學空間有一千六百多億個分子。因此,一種快速的分子屬性測定方法能夠極大加速尋求特定分子的進程。但是傳統物理上常用的密度泛函分析方法(Density Function Theory,下面簡稱為DFT),在時間效率上并不理想,無法對大量數據進行處理。
圍繞該問題,研究者們提出了很多方法,但其中大部分仍然是基于DFT開發的。與此同時,該研究領域已經積累了許多相關的數據,但是大部分方法都無法利用這些已有的數據。
發明內容
有鑒于此,本發明要解決的技術問題在于提供一種基于人工神經網絡的分子屬性預測方法,該分子屬性預測方法可充分利用已有的數據,且具有較好的速度與精度。
本發明提供了一種基于人工神經網絡的分子屬性預測方法,包括:
S1)對分子數據進行預處理:通過圖的數據結構表征的方法,得到原子空間表征與原子構成表征;
S2)建立模型:將原子空間表征與原子構成表征通過多層卷積神經網絡,得到分子各級的表征,并將分子各級的表征進行組合,得到模型;
S3)根據模型預測分子屬性。
優選的,所述步驟S1)具體為:
分子數據包括分子的原子構成與原子的三維空間坐標;
將原子的三維空間坐標轉換為原子之間的距離矩陣,然后通過徑向基函數擴展為距離張量,得到原子空間表征;
將分子的原子構成進行嵌入表示,得到原子構成表征。
優選的,距離矩陣通過徑向基函數擴展為距離張量,具體按照以下模型進行:
其中,x為距離矩陣中的每對距離;∩表示對元素的拼接;μi為中心點;||x-μi||表示x到第i個中心點的歐幾里得距離;h為高斯核,K為最短距離到最長距離選取中心點的數量;
通過徑向基函數得到張量D∈RN×N×K,N為距離矩陣中每對距離的數量。
優選的,將分子的原子構成進行嵌入表示,具體按照以下步驟進行:
用向量表示分子中的節點和邊,將原子看做分子中的節點,其表示為向量a0∈RD,進而得到整個分子的節點表示矩陣A0∈RN×D,經嵌入表示得到邊表征矩陣為E∈RN×D×D。
優選的,將原子空間表征與原子構成表征通過多層卷積神經網絡,得到分子各級的表征具體為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學技術大學,未經中國科學技術大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811258268.X/2.html,轉載請聲明來源鉆瓜專利網。





