[發明專利]晶體結構生成方法、裝置、電子設備及計算機可讀存儲介質在審
| 申請號: | 202211698891.3 | 申請日: | 2022-12-28 |
| 公開(公告)號: | CN116343937A | 公開(公告)日: | 2023-06-27 |
| 發明(設計)人: | 王火斌;袁久闖 | 申請(專利權)人: | 深圳晶泰科技有限公司 |
| 主分類號: | G16C20/20 | 分類號: | G16C20/20;G16C20/70;G06N3/094 |
| 代理公司: | 北京匯鑫君達知識產權代理有限公司 11769 | 代理人: | 劉湘菲 |
| 地址: | 518000 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 晶體結構 生成 方法 裝置 電子設備 計算機 可讀 存儲 介質 | ||
本申請提供一種晶體結構生成方法和裝置、設備、電子設備和計算機可讀存儲介質,該方法包括獲得擬預測分子的第一晶體結構集;以第一晶體結構集為訓練集特征提取,分別得到訓練集中的各晶體結構的特征向量;根據訓練集中的各晶體結構的特征向量訓練生成神經網絡;根據神經網絡生成擬預測分子的第二晶體結構;特征向量包括:晶胞參數或者晶胞的自由度,分子構象的柔性角或者分子構象,以及分子構象在晶胞中的位置和擺放姿態,或者分子構象在晶胞中的中心位置和指向;本申請能夠提高擬預測分子的晶體結構的生成效率。
技術領域
本申請涉及深度學習領域,尤其涉及一種晶體結構生成方法和裝置、電子設備和計算機可讀存儲介質。
背景技術
快速生成不同類型的晶體結構是晶型預測的最關鍵步驟之一。目前工業上生成晶體結構的主要方法一般是基于全局、局部、隨機等傳統的搜索算法。晶體結構的搜索空間是巨大的,傳統的全局搜索算法非常耗時,局部搜索算法容易陷入局部最優解。尤其對有多個柔性維度的晶體來說,隨著晶體結構的自由度增大,對應的搜索空間是呈指數增加的。
發明內容
本申請能夠提高擬預測分子的晶體結構的生成效率,提供一種晶體結構生成方法,包括:
步驟A:獲得擬預測分子的第一晶體結構集,所述第一晶體結構集包括多個晶體結構;
步驟B:以所述第一晶體結構集為訓練集進行特征提取,分別得到所述訓練集中的各晶體結構的特征向量;
步驟C:根據所述第一晶體結構集中的各晶體結構的特征向量訓練生成神經網絡;
步驟D:根據所述神經網絡生成所述擬預測分子的第二晶體結構集,所述第二晶體結構集包括至少一個晶體結構;
其中,所述特征向量包括:
晶胞參數或者晶胞的自由度,
分子構象的柔性角或者分子構象,以及
分子構象在晶胞中的位置和擺放姿態,或者分子構象在晶胞中的中心位置和指向。
可選地,所述方法還包括:
步驟E:從所述第二晶體結構集中過濾出所述擬預測分子的有效晶體結構,當過濾出的各所述擬預測分子的有效晶體結構與所述第一晶體結構集中的所有晶體結構的差異度均小于第一預設閾值時,將過濾出的所述擬預測分子的有效晶體結構輸出作為所述擬預測分子的晶體結構。
可選地,所述差異度是根據過濾出的有效晶體結構與所述訓練集中的晶體結構的均方根偏差值確定的。
可選地,所述步驟E還包括:
當至少一個過濾出的所述擬預測分子的有效晶體結構與所述第一晶體結構集中的所有晶體結構的差異度不小于第一預設閾值時,將所述至少一個過濾出的所述擬預測分子的有效晶體結構加入所述訓練集中,并再次執行所述步驟B至所述步驟E。
可選地,所述獲得擬預測分子的第一晶體結構集,包括:
通過隨機算法生成預設數量的所述擬預測分子的多個有效晶體結構。
可選地,所述神經網絡為對抗神經網絡(WGAN)模型;所述對抗神經網絡模型包括一個用于生成擬預測分子的晶體結構的生成器,和一個用于判別生成器生成的擬預測分子的晶體結構是否接近于真實的判別器。
可選地,所述根據所述訓練集中的各晶體結構的特征向量訓練生成神經網絡,包括:
在均勻分布空間中隨機采樣z向量,輸入生成器生成擬預測分子的晶體結構,然后判別器以生成器生成的擬預測分子的晶體結構與第一晶體結構集中的多個晶體結構之間的Wasserstein距離作為代價函數,若代價函數滿足預設標準,則停止訓練,若代價函數不滿足預設標準,則重復執行本步驟以進一步訓練所述生成器和判別器。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳晶泰科技有限公司,未經深圳晶泰科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211698891.3/2.html,轉載請聲明來源鉆瓜專利網。





