[發明專利]分子屬性測定方法、裝置、電子設備及存儲介質有效
| 申請號: | 202010594496.5 | 申請日: | 2020-06-24 |
| 公開(公告)號: | CN111724867B | 公開(公告)日: | 2022-09-09 |
| 發明(設計)人: | 劉淇;陳恩紅;郝中楷;陸承鏹;黃振亞 | 申請(專利權)人: | 中國科學技術大學 |
| 主分類號: | G16C20/30 | 分類號: | G16C20/30;G16C20/70;G16C20/80;G16C60/00;G06N3/04;G06N3/08 |
| 代理公司: | 中科專利商標代理有限責任公司 11021 | 代理人: | 周天宇 |
| 地址: | 230026 安*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 分子 屬性 測定 方法 裝置 電子設備 存儲 介質 | ||
一種分子屬性測定方法、裝置、電子設備及存儲介質,應用于分子技術領域,包括:S1用分子拓撲結構圖表示每個帶標簽分子的分子屬性數據和每個無標簽分子的分子結構數據;S2、將所有帶標簽分子和所有無標簽分子的分子結構拓撲圖輸入至預先構建的教師模型,利用半監督學習對所有分子結構拓撲圖進行訓練,得到教師模型的參數;S3、將教師模型的參數遷移到預先構建的學生模型中;S4、利用帶標簽分子調整學生模型;S5、利用調整后的學生模型給所有無標簽分子均賦予標簽,得到帶標簽分子集;S6、將帶標簽分子集反饋給教師模型;重復執行步驟S2至S6,直至教師模型和學生模型均收斂,利用收斂后的學生模型預測分子屬性。可精準地預測未知分子的屬性。
技術領域
本申請涉及分子測定技術領域,尤其涉及一種分子屬性測定方法、裝置、電子設備及存儲介質。
背景技術
新物質材料的發現往往能夠帶動技術發展和社會進步,從藥物研發,到材料開發,都離不開分子發現。在許多領域,為了尋求到具有特定屬性的分子,需要對某個可能分子的待選集合。對于集合中的每個分子,需要預測其屬性,如果滿足要求,則進行進一步研究。預測分子屬性的方法主要分為兩種,一種是使用傳統的物理方法例如密度泛函分析方法,但是這種方法過于耗時無法處理大量數據;另一類方法是數據驅動方法,這類方法從已有數據中學習到分子屬性的相關知識并以此來對未知屬性進行屬性預測。但是數據驅動的方法十分依賴于已知屬性的分子數據(稱作帶標簽分子),而帶標簽分子的數量又非常少,與此同時,大量未知分子屬性的分子數據(稱作無標簽分子)沒有被利用起來。
發明內容
本申請的主要目的在于提供一種分子屬性測定方法、裝置、電子設備及存儲介質,可精準預測未知分子的屬性。
為實現上述目的,本申請實施例第一方面提供一種分子屬性測定方法,包括:
S1、用分子拓撲結構圖表示每個帶標簽分子的分子屬性數據和每個無標簽分子的分子結構數據;
S2、將所有所述帶標簽分子和所有所述無標簽分子的分子結構拓撲圖輸入至預先構建的教師模型,利用半監督學習對所有分子結構拓撲圖進行訓練,得到所述教師模型的參數;
S3、將所述教師模型的參數遷移到預先構建的學生模型中;
S4、利用所述帶標簽分子調整所述學生模型;
S5、利用調整后的學生模型給所有無標簽分子均賦予標簽,得到帶標簽分子集;
S6、將所述帶標簽分子集反饋給所述教師模型;
重復執行步驟S2至S6,直至所述教師模型和所述學生模型均收斂,利用收斂后的學生模型預測分子屬性。
可選的,所述步驟S2中,使用有監督學習的屬性損失函數和無監督學習的重建損失函數的和作為半監督學習的損失函數來訓練所述教師模型,并使用小批次隨機梯度下降算法來更新所述教師模型的參數。
可選的,基于帶標簽分子表示所述有監督學習的屬性損失函數,以及,基于無標簽分子從節點級別和圖級別表示所述無監督學習的重建損失函數。
可選的,所述基于帶標簽分子表示所述有監督學習的屬性損失函數包括:
利用帶標簽分子的標簽和教師模型輸出的帶標簽分子的預測屬性值之間的均方根誤差表示所述有監督學習的損失函數;
令Lp為所述有監督學習的屬性損失函數,則:
其中,yi為第i個帶標簽分子的標簽,fθ為所述教師模型表示的函數,為所述教師模型提取的第i個帶標簽分子的表征,為所述教師模型輸出的第i個帶標簽分子的預測屬性值,N1為帶標簽分子的數量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學技術大學,未經中國科學技術大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010594496.5/2.html,轉載請聲明來源鉆瓜專利網。





