[發(fā)明專利]一種基于主動學習的材料數(shù)據(jù)集篩選方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 202210036212.X | 申請日: | 2022-01-13 |
| 公開(公告)號: | CN114386512A | 公開(公告)日: | 2022-04-22 |
| 發(fā)明(設計)人: | 錢權;陳水洲 | 申請(專利權)人: | 上海大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N20/00 |
| 代理公司: | 北京方圓嘉禾知識產(chǎn)權代理有限公司 11385 | 代理人: | 程華 |
| 地址: | 200444*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 主動 學習 材料 數(shù)據(jù) 篩選 方法 系統(tǒng) | ||
1.一種基于主動學習的材料數(shù)據(jù)集篩選方法,其特征在于,所述擴充方法包括如下步驟:
抽取未檢測的數(shù)據(jù)池中的不同材料數(shù)據(jù)對初始訓練數(shù)據(jù)池進行擴充,獲得多個擴充得到的訓練數(shù)據(jù)池及多個訓練得到的基線模型,作為初步篩選結果;所述訓練得到的基線模型為利用擴充得到的訓練數(shù)據(jù)池對基線模型進行訓練獲得的;所述未檢測的數(shù)據(jù)池包括收集得到的未驗證的文獻數(shù)據(jù);所述初始訓練數(shù)據(jù)池包括實驗數(shù)據(jù);
從所述初步篩選結果中,選取性能參數(shù)最優(yōu)的訓練得到的基線模型和性能最優(yōu)的訓練得到的基線模型對應的擴充得到的訓練數(shù)據(jù)池作為數(shù)據(jù)集篩選結果。
2.根據(jù)權利要求1所述的基于主動學習的材料數(shù)據(jù)集篩選方法,其特征在于,所述抽取未檢測的數(shù)據(jù)池中的不同材料數(shù)據(jù)對初始訓練數(shù)據(jù)池進行擴充,獲得多個擴充得到的訓練數(shù)據(jù)池及多個訓練得到的基線模型,作為初步篩選結果,具體包括:
滑動窗口j在未檢測的數(shù)據(jù)池中選取材料數(shù)據(jù),得到多個數(shù)據(jù)候選塊,并將多個所述數(shù)據(jù)候選塊添加至候選集合;
將候選集合中的每個數(shù)據(jù)候選塊分別添加至第m次擴充后的訓練數(shù)據(jù)池中,獲得多個第m+1次擴充后的訓練數(shù)據(jù)池;其中,第0次擴充后的訓練數(shù)據(jù)池為所述初始訓練數(shù)據(jù)池;
利用第m+1次擴充得到的訓練數(shù)據(jù)池對基線模型進行訓練,獲得第m+1次訓練后的基線模型,并計算第m+1次訓練后的基線模型的性能得分,得到n個加入數(shù)據(jù)候選塊后的第m+1次擴充后訓練數(shù)據(jù)池的性能得分;
選取性能得分最高的擴充后的訓練數(shù)據(jù)池,作為第m+1次擴充得到的訓練數(shù)據(jù)池,選取性能得分最高的訓練后的基線模型作為第m+1次訓練得到的基線模型,并將性能得分最高的擴充后的訓練數(shù)據(jù)池中添加的數(shù)據(jù)候選塊從所述候選集合中刪除;
判斷訓練得到的基線模型的性能得分連續(xù)下降的次數(shù)超過第一預設閾值,獲得第一判斷結果;
若所述第一判斷結果表示否,則令m的數(shù)值增加1,清空所述候選集合,調用訓練數(shù)據(jù)池擴充子模塊;
若所述第一判斷結果表示是,則選取性能得分最高的訓練得到的基線模型、性能得分最高的訓練得到的基線模型對應的擴充得到的訓練數(shù)據(jù)池和性能得分,作為窗口j對應的第k個初步篩選結果;
判斷k的數(shù)值是否小于第二預設閾值K,獲得第二判斷結果;
若所述第二判斷結果表示是,則打亂未檢測的數(shù)據(jù)池中材料數(shù)據(jù)的順序,并令k的數(shù)值增加1,令m的數(shù)值為0,清空所述候選集合,返回步驟“滑動窗口j在未檢測的數(shù)據(jù)池中選取材料數(shù)據(jù),得到多個數(shù)據(jù)候選塊,并將多個所述數(shù)據(jù)候選塊添加至候選集合”;
若所述第二判斷結果表示否,則判斷j的數(shù)值是否小于第三預設閾值J,獲得第三判斷結果;
若所述第三判斷結果表示是,則對窗口j進行更新,獲得窗口j+1,令j的數(shù)值增加1,令m和k的數(shù)值為0,清空所述候選集合,返回步驟“滑動窗口j在未檢測的數(shù)據(jù)池中選取材料數(shù)據(jù),得到多個數(shù)據(jù)候選塊,并將多個所述數(shù)據(jù)候選塊添加至候選集合”;
若所述第三判斷結果表示否,則輸出K×J個初步篩選結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海大學,未經(jīng)上海大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210036212.X/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。





