[發(fā)明專利]一種基于自動機器學(xué)習的化學(xué)材料吸附性能預(yù)測方法及裝置在審
| 申請?zhí)枺?/td> | 202110318374.8 | 申請日: | 2021-03-25 |
| 公開(公告)號: | CN112966447A | 公開(公告)日: | 2021-06-15 |
| 發(fā)明(設(shè)計)人: | 王坤峰;楊培松;張歡;賴欣;陽慶元;俞度立 | 申請(專利權(quán))人: | 北京化工大學(xué) |
| 主分類號: | G06F30/27 | 分類號: | G06F30/27;G06F119/18 |
| 代理公司: | 北京翔石知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11816 | 代理人: | 李勇 |
| 地址: | 100029 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 自動 機器 學(xué)習 化學(xué)材料 吸附 性能 預(yù)測 方法 裝置 | ||
本發(fā)明涉及機器學(xué)習技術(shù)領(lǐng)域,一個方面提供基于自動機器學(xué)習的化學(xué)材料吸附性能預(yù)測方法,包括:獲取化學(xué)材料的結(jié)構(gòu)特征構(gòu)建原始數(shù)據(jù)集;對原始數(shù)據(jù)集進行預(yù)處理,根據(jù)機器學(xué)習生成包含超參數(shù)的初始模型;利用管道方法初始模型迭代訓(xùn)練生成最佳預(yù)測模型;將測試數(shù)據(jù)集輸入到最佳預(yù)測模型對化學(xué)材料的吸附性能進行預(yù)測;本發(fā)明所述方法可以快速準確地實現(xiàn)材料吸附性能預(yù)測。本發(fā)明的另一個方面提供一種基于自動機器學(xué)習的化學(xué)材料吸附性能預(yù)測裝置,包括數(shù)據(jù)集構(gòu)建模塊、模型預(yù)訓(xùn)練模塊、模型構(gòu)件模塊以及測試模塊;用以將上述方法應(yīng)用在該裝置以進行化學(xué)材料吸附性能的預(yù)測。
技術(shù)領(lǐng)域
本發(fā)明涉及機器學(xué)習技術(shù)領(lǐng)域,尤其涉及一種基于自動機器學(xué)習的化學(xué)材料吸附性能預(yù)測方法及裝置。
背景技術(shù)
化學(xué)材料的篩選與設(shè)計對重要化工氣體的存儲與運輸具有重要意義。但是合成的氣體存儲的材料種類多種多樣,數(shù)量龐大,將其用于氣體吸附工作容量的研究時,需要通過分子動力學(xué)模擬的方法實現(xiàn),這種方法雖然準確,但是十分耗時,要想從海量的存儲材料中尋找出合適的存儲材料,依靠傳統(tǒng)的計算方法顯然是不可行的。
機器學(xué)習給材料性能計算帶來了極大的便利,但同時也存在的一些問題。隨著算法的種類的增加與復(fù)雜度的提升,工程師需要選擇相應(yīng)的模型架構(gòu),訓(xùn)練過程,正則化方法以及超參數(shù)等,這些都對算法的性能有很大的影響。構(gòu)建準確而強大的學(xué)習模型的過程需要先進的數(shù)據(jù)科學(xué)技能,為解決問題而選擇適當?shù)姆椒ú樘囟P团渲米罴褏?shù)值也是一項艱巨的任務(wù)。因此,如何快速有效地計算材料的吸附性能,篩選出合適的氣體存儲材料,成為亟需解決的問題。
現(xiàn)有技術(shù)存在以下問題。第一,傳統(tǒng)材料計算方法速度慢,效率低,無法滿足現(xiàn)有需求。第二,普通機器學(xué)習算法的調(diào)參過程復(fù)雜,對非專業(yè)人員使用的要求門檻較高。第三,沒有關(guān)于材料預(yù)測內(nèi)容的管道模型的設(shè)計。
發(fā)明內(nèi)容
為此,本發(fā)明一個方面提供一種基于自動機器學(xué)習的材料吸附性能預(yù)測方法。包括通過數(shù)據(jù)構(gòu)件模塊獲取化學(xué)材料的特征并建立原始數(shù)據(jù),通過模型預(yù)訓(xùn)練模塊建立初始模型,通過模型構(gòu)建模塊生成最佳預(yù)測模型以及通過測試模塊預(yù)測化學(xué)材料的吸附性能。用以克服現(xiàn)有技術(shù)中因沒有關(guān)于材料預(yù)測內(nèi)容的管道模型的設(shè)計導(dǎo)致的對材料吸附性能預(yù)測速度慢,進一步導(dǎo)致效率低的問題。
為實現(xiàn)上述目的,本發(fā)明提供一種基于自動機器學(xué)習的化學(xué)材料吸附性能預(yù)測方法,包括:
獲取與化學(xué)材料吸附性能具有相關(guān)性的多種特征,并結(jié)合不同類型的特征建立原始數(shù)據(jù)集,并對該原始數(shù)據(jù)集進行預(yù)處理;
對所述預(yù)處理完成的原始數(shù)據(jù)集進行特征處理并利用機器學(xué)習以根據(jù)特征處理完成的原始數(shù)據(jù)利用機器學(xué)習生成多個包含超參數(shù)的初始模型;
通過管道方法對多個所述初始模型進行迭代訓(xùn)練以生成最佳預(yù)測模型;
將測試數(shù)據(jù)集輸入至所述最佳預(yù)測模型以進行化學(xué)材料吸附性能預(yù)測。
進一步地,針對所述原始數(shù)據(jù)的預(yù)處理的方法包括數(shù)據(jù)采樣、數(shù)據(jù)清洗、特征壓縮、特征轉(zhuǎn)換以及特征提取中的一種或多種;
所述通過機器學(xué)習生成多個包含超參數(shù)的初始模型的方法包括對所述原始數(shù)據(jù)進行特征處理以保證數(shù)據(jù)的合理性,以及選取不同的機器進行學(xué)習以根據(jù)先驗知識生成多個包含超參數(shù)的初始模型。
進一步地,所述通過管道方法對多個所述初始模型進行迭代訓(xùn)練獲得最佳預(yù)測模型的方法包括:根據(jù)特征重要性對所述特征處理完成的數(shù)據(jù)集進行數(shù)據(jù)篩選和特征處理并通過遺傳算法和迭代法地對所述初始模型進行調(diào)參。
進一步地,所述數(shù)據(jù)篩選包括使用SelectKBest方法選擇最優(yōu)的前n%的特征信息并移除不符合最小方差閾值的特征信息,該選擇方法通過卡方驗證和互信息結(jié)合計算得出最優(yōu)的前n%特征,公式如下所示:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京化工大學(xué),未經(jīng)北京化工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110318374.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 根據(jù)用戶學(xué)習效果動態(tài)變化下載學(xué)習數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個人化學(xué)習服務(wù)的方法
- 漸進式學(xué)習管理方法及漸進式學(xué)習系統(tǒng)
- 輔助學(xué)習的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲介質(zhì)
- 基于強化學(xué)習的自適應(yīng)移動學(xué)習路徑生成方法
- 一種線上視頻學(xué)習系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習方法、裝置及設(shè)備
- 一種學(xué)習方案推薦方法、裝置、設(shè)備和存儲介質(zhì)
- 游戲?qū)W習效果評測方法及系統(tǒng)





