[發明專利]分子屬性測定方法、裝置、電子設備及存儲介質有效
| 申請號: | 202010594496.5 | 申請日: | 2020-06-24 |
| 公開(公告)號: | CN111724867B | 公開(公告)日: | 2022-09-09 |
| 發明(設計)人: | 劉淇;陳恩紅;郝中楷;陸承鏹;黃振亞 | 申請(專利權)人: | 中國科學技術大學 |
| 主分類號: | G16C20/30 | 分類號: | G16C20/30;G16C20/70;G16C20/80;G16C60/00;G06N3/04;G06N3/08 |
| 代理公司: | 中科專利商標代理有限責任公司 11021 | 代理人: | 周天宇 |
| 地址: | 230026 安*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 分子 屬性 測定 方法 裝置 電子設備 存儲 介質 | ||
1.一種分子屬性測定方法,其特征在于,包括:
S1、用分子拓撲結構圖表示每個帶標簽分子的分子屬性數據和每個無標簽分子的分子結構數據;
S2、將所有所述帶標簽分子和所有所述無標簽分子的分子結構拓撲圖輸入至預先構建的教師模型,利用半監督學習對所有分子結構拓撲圖進行訓練,得到所述教師模型的參數;
S3、將所述教師模型的參數遷移到預先構建的學生模型中;
S4、利用所述帶標簽分子調整所述學生模型;
S5 、 利用調整后的學生模型給所有無標簽分子均賦予標簽,得到帶標簽分子集;
S6 、 將所述帶標簽分子集反饋給所述教師模型;
重復執行步驟S2至S6 直至所述教師模型和所述學生模型均收斂,利用收斂后的學生模型預測分子屬性;
其中,基于帶標簽分子表示所述有監督學習的屬性損失函數,以及,基于無標簽分子從節點級別和圖級別表示所述無監督學習的重建損失函數。
2.根據權利要求1所述的分子屬性測定方法,其特征在于,所述步驟S2中,使用有監督學習的屬性損失函數和無監督學習的重建損失函數的和作為半監督學習的損失函數來訓練所述教師模型,并使用小批次隨機梯度下降算法來更新所述教師模型的參數。
3.根據權利要求1所述的分子屬性測定方法,其特征在于,所述基于帶標簽分子表示所述有監督學習的屬性損失函數包括:
利用帶標簽分子的標簽和教師模型輸出的帶標簽分子的預測屬性值之間的均方根誤差表示所述有監督學習的損失函數;
令Lp為所述有監督學習的屬性損失函數,則:
其中,yi為第i個帶標簽分子的標簽,fθ為所述教師模型表示的函數,為所述教師模型提取的第i個帶標簽分子的表征,為所述教師模型輸出的第i個帶標簽分子的預測屬性值,N1為帶標簽分子的數量。
4.根據權利要求1所述的分子屬性測定方法,其特征在于,所述基于無標簽分子從節點級別表示所述無監督學習的重建損失函數包括:
獲取所述教師模型輸出的無標簽分子節點級別的表征;
基于節點級別表示學習,使用節點嵌入從表示形式重建無標簽分子的分子拓撲結構圖中的節點類型和節點之間的距離,得到重建后的無標簽分子的結構;
利用節點重建的損失函數和邊權重重建函數,表示所述無監督學習的節點級別的重建損失函數。
5.根據權利要求1所述的分子屬性測定方法,其特征在于,所述基于無標簽分子從圖級別表示所述無監督學習的重建損失函數包括:
S21、獲取所述教師模型輸出的無標簽分子圖級別的表征;
S22、基于隱式聚類方法為每個無標簽分子分配一個簇ID,所述ID包含由隱式聚類過程生成的多個簇的標記;
S23、使用預設的懲罰損失函數優化教師模型;
重復執行步驟S21至S23,直至至少所述懲罰損失函數收斂,使用聚類損失表示所述無監督學習的圖級別的重建損失函數。
6.一種分子屬性測定裝置,其特征在于,包括:
結構表示模塊,用于用分子拓撲結構圖表示每個帶標簽分子的分子屬性數據和每個無標簽分子的分子結構數據;
輸入訓練模塊,用于將所有所述帶標簽分子和所有所述無標簽分子的分子結構拓撲圖輸入至預先構建的教師模型,利用半監督學習對所有分子結構拓撲圖進行訓練,得到所述教師模型的參數;
遷移模塊,用于將所述教師模型的參數遷移到預先構建的學生模型中;
調整模塊,用于利用所述帶標簽分子調整所述學生模型;
賦予模塊,用于利用調整后的學生模型給所有無標簽分子均賦予標簽,得到帶標簽分子集;
反饋模塊,用于將所述帶標簽分子集反饋給所述教師模型;
重復執行上述模塊,直至所述教師模型和所述學生模型均收斂,利用收斂后的學生模型預測分子屬性;
其中,基于帶標簽分子表示所述有監督學習的屬性損失函數,以及,基于無標簽分子從節點級別和圖級別表示所述無監督學習的重建損失函數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學技術大學,未經中國科學技術大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010594496.5/1.html,轉載請聲明來源鉆瓜專利網。





