[發明專利]一種基于圖神經網絡的定向分子生成方法在審
| 申請號: | 202110318381.8 | 申請日: | 2021-03-25 |
| 公開(公告)號: | CN113140267A | 公開(公告)日: | 2021-07-20 |
| 發明(設計)人: | 王坤峰;賴欣;楊培松;陽慶元;俞度立 | 申請(專利權)人: | 北京化工大學 |
| 主分類號: | G16C60/00 | 分類號: | G16C60/00;G16C20/50;G06N3/04;G06N3/08 |
| 代理公司: | 北京翔石知識產權代理事務所(普通合伙) 11816 | 代理人: | 李勇 |
| 地址: | 100029 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 神經網絡 定向 分子 生成 方法 | ||
本發明涉及一種基于圖神經網絡的定向分子生成方法,涉及材料分子技術領域。包括:將有機分子結構圖拓撲映射的方式轉換成分子圖,并將分子圖的嵌入表示作為圖神經網絡模型的輸入;通過圖神經網絡模型,基于消息傳播過程來學習這些分子圖,包含其中節點和邊的表示;通過圖神經網絡來學習生成的這些表示,以便于在圖生成過程中進行各種決策;決策過程中,將新結構以符合有機分子化學規則的形式,添加到現有圖中,該添加事件的概率取決于圖的歷史圖推導過程。最終生成的新型分子經過化學價效約束確認,可以確保生成分子的化學有效性。本發明可以針對有機分子數據庫,生成有效的、化學性質與原始分子相似的新型分子結構。
技術領域
本發明涉及材料分子技術領域,尤其涉及一種基于圖神經網絡的定向分子生成方法。
背景技術
在我們的日常生活中,隨處可見圖神經網絡的身影。它們用來構建復雜的系統,如經濟、自然、社會科學等組成的許多拓撲結構,如社會網絡、生物醫學領域的效能網絡、化學材料領域材料分子的合成和性能預測等,在社會生活的許多實際場景中都有實際意義。例如,在社交網絡中向用戶推薦感興趣的內容和用戶,在PPI生物網絡中識別蛋白質的功能,或者預測現有材料針對某種物理和化學性能的能力。近年來,機器學習已經成為一種高效的研究方法,用于下游圖分析任務的圖形表示,包括節點分類、鏈路預測、聚簇分析檢測等圖分析任務。
設計具有所需性能的新分子結構是材料科學和藥物發現等應用中的一個重要問題。這個問題很有挑戰性,因為化學空間是離散的,整個搜索空間是巨大的,據科學計算,其數量級高達1033。由于這些領域的數據量很大,機器學習技術在該領域中可以發揮很好的作用。該領域利用機器學習進行分子生成的模型,主要有利用變分自動編碼器VAEs的深度生成模型、生成對抗網絡(GANs)生成模型、基于節點樹的變分自動編碼器(JT-VAE)的生成模型,和基于神經網絡的迭代生成模型等。
其中,通過將分子結構的線性字符串表示,并使用深度生成模型(如變分自動編碼器,VAEs)來生成圖的線性表示,VAEs是一種利用自動編碼方式結合變分下界求解貝葉斯圖模型隱變量的方法論實例。生成對抗網絡(GANs)生成模型,它是通過判別器網絡來進行優化,讓生成器產生數據的分布直接擬合訓練數據的分布,以此來生成分子。結點樹VAE(JT-VAE),一種巧妙地以樹狀結構用于分子結構編碼和解碼的算法。圖卷積策略網絡(GCPN)方法,該方法將分子圖的生成表示為一個迭代決策過程,并基于現有的圖子結構生成節點和邊。另一項名為分子遞歸神經網絡(MRNN)的相關工作提出的迭代采樣模型在分子圖生成上表現出令人印象深刻的性能。圖卷積策略網絡和分子遞歸神經網絡都證明了由圖本身迭代生成節點和邊是一種實用的圖生成方法。
現有方法存在以下問題。第一,變分自編碼器等方法主要是針對分子的SMILES字符串表示做新分子的生成,無法處理非歐式數據,比如分子圖形式的分子數據。第二,采樣過程不同,變分自編碼器采用one-hot采樣方法,而非序列化迭代采樣。第三,生成分子的有效性問題,目前的分子生成算法生成原子序列的順序多采取隨機順序,這樣會產生大量生成無效分子,生成分子的有效率很低。
發明內容
為此,本發明的目的是提供一種基于圖神經網絡的定向分子生成方法。具體實現過程為,通過將化學分子結構映射為分子圖,并通過圖神經網絡學習該圖,同時針對生成節點順序,利用寬度優先搜索算法用以克服現有技術中采取隨機順序而產生大量生成無效分子的問題。
為實現上述過程,本發明提供一種基于圖神經網絡的定向分子生成方法,包括:
步驟a,將有機分子結構通過圖結構拓撲映射轉換成分子圖同時將該有機分子結構中的原子和化學鍵轉換為分子圖中的節點和邊,并將分子圖的嵌入表示作為圖神經網絡模型輸入;
步驟b,通過圖神經網絡模型,利用消息傳播過程學習所述分子圖的輸入表示、學習該分子圖的節點和邊的表示并生成新節點和新邊的表示;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京化工大學,未經北京化工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110318381.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種危重癥患者護理用患者體位轉換裝置
- 下一篇:低溫地板輻射地面結構





