[發明專利]一種基于化學元素知識圖譜的分子圖對比學習方法在審
| 申請號: | 202111181509.7 | 申請日: | 2021-10-11 |
| 公開(公告)號: | CN113990408A | 公開(公告)日: | 2022-01-28 |
| 發明(設計)人: | 陳華鈞;方尹;楊海宏;莊祥;陳卓 | 申請(專利權)人: | 浙江大學 |
| 主分類號: | G16C20/30 | 分類號: | G16C20/30;G16C20/70;G16C20/80;G06N3/04;G06K9/62;G06V10/74;G06V10/774 |
| 代理公司: | 杭州天勤知識產權代理有限公司 33224 | 代理人: | 曹兆霞 |
| 地址: | 310013 浙江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 化學元素 知識 圖譜 分子 對比 學習方法 | ||
本發明公開了一種基于化學元素知識圖譜的分子圖對比學習方法,包括:根據化學元素周期表中每個化學元素的所有化學屬性,構建化學元素知識圖譜;利用化學元素知識圖譜對分子圖進行圖增強得到分子增強圖;利用可插拔表示模型獲得分子圖和分子增強圖的圖表示;采用硬負樣本挖掘技術選出與分子圖在分子指紋空間相似的其他分子圖作為負樣本;將正樣本對和負樣本對的圖表示映射到同一空間后,通過最大化正樣本對之間的一致性同時最小化負樣本對之間的一致性構建對比損失函數,利用對比損失函數進行優化學習;將參數確定的可插拔表示模型與非線性分類器形成預測模型,利用參數微調的預測模型進行分子圖的分子性質的預測,以提升分子性質的預測準確性。
技術領域
本發明涉及圖對比學習領域,具體涉及一種基于化學元素知識圖譜的分子圖對比學習方法。
背景技術
在過去幾年中,圖表示學習(Graph Representation Learning,GRL)已成為分析圖結構數據的熱門研究領域。圖表示學習旨在學習一種將具有復雜結構的圖數據轉換為保留多樣化圖屬性和結構特征的低維空間中的密集表示的編碼函數。
傳統的圖表示學習方法,利用隨機游走將圖轉化為節點序列,以此建模中心節點與鄰居節點之間的共現關系。但是這類學習框架有兩個明顯的缺點:一是編碼器之間缺少參數共享,會占用過多計算資源;二是模型缺乏泛化能力,難以推廣應用于新圖。近年來,使用圖神經網絡進行圖表示學習受到了廣泛關注。圖神經網絡通常通過領域狀態的加權總和來更新節點的隱藏狀態。通過節點之間的信息傳遞,圖神經網絡能夠捕捉來自其領域的信息。
分子圖是一類天然具有豐富結構信息的圖數據,目前有眾多研究利用深度學習方法學習分子圖的嵌入表示,以加速藥物的研發和分子識別。其中,有監督學習方法通過改進消息傳遞過程及網絡架構,學習分子在低維空間中的表示,并應用于下游的性質預測任務。但獲取分子性質標簽的實驗過程既耗時又消耗資源,任務面臨標記數據不足等問題。同時,由于分子空間極為龐大,模型泛化能力較差,限制了其在實際場景中的應用。一些工作設計了復雜的預訓練任務學習分子的圖表示。
圖對比學習作為預訓練模型的一種,利用圖增強方法在輸入圖上進行隨機擴充,獲得兩個視圖,并使兩個視圖的表示一致性最大化,以此自監督地學習圖嵌入表示。這樣的自監督學習方式可以從數據本身中為學習算法挖掘監督信息。盡管圖對比學習方法得到了長足的發展,但圖增強方法的設計仍然很少被探索。傳統的圖增強方法包括節點刪除、邊緣擾動、子圖提取和屬性屏蔽。但是該對比框架在應用于分子圖時有兩個明顯的缺點:第一,去除或添加化學鍵或基團將改變分子圖的特性和化學含義;第二,分子圖中的原子被建模為通過化學鍵連接才可以產生聯系的個體,沒有考慮原子微觀層面的相關性(具有相同屬性的原子之間的共性)。
因此,亟需設計一種新的分子圖對比學習方法,來解決現有技術存在的上述問題。
發明內容
將于上述,本發明的目的是提供一種基于化學元素知識圖譜的分子圖對比學習方法,通過化學元素知識圖譜指導圖增強方法,提升了分子性質預測的準確性。
為實現以上發明目的,本發明提供以下技術方案:
一種基于化學元素知識圖譜的分子圖對比學習方法,包括以下步驟:
依據從化學元素周期表獲得的每個化學元素的所有化學屬性,構建化學元素知識圖譜,以建立化學元素之間的微觀化學聯系;
利用化學元素知識圖譜對分子圖進行圖增強,以獲得同時包含拓撲結構和化學領域知識的分子增強圖;
利用可插拔表示模型獲得分子圖和分子增強圖的圖表示;
采用硬負樣本挖掘技術選出與分子圖在分子指紋空間相似的其他分子圖作為負樣本,分子圖與其對應的分子增強圖組成正樣本對,分子圖分別與其對應的負樣本、負樣本對應的分子增強圖組成負樣本對,分子圖對應的分子增強圖分別與分子圖對應的負樣本、負樣本對應的分子增強圖組成負樣本對;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江大學,未經浙江大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111181509.7/2.html,轉載請聲明來源鉆瓜專利網。





