[發(fā)明專利]一種基于主動學習的材料數(shù)據(jù)集篩選方法及系統(tǒng)在審

申請?zhí)枺?/td>	202210036212.X	申請日：	2022-01-13
公開（公告）號：	CN114386512A	公開（公告）日：	2022-04-22
發(fā)明（設計）人：	錢權;陳水洲	申請（專利權）人：	上海大學
主分類號：	G06K9/62	分類號：	G06K9/62;G06N20/00
代理公司：	北京方圓嘉禾知識產(chǎn)權代理有限公司 11385	代理人：	程華
地址：	200444***	國省代碼：	上海;31
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種基于主動學習材料數(shù)據(jù) 篩選方法系統(tǒng)
鉆瓜網(wǎng) 技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種基于主動學習的材料數(shù)據(jù)集篩選方法，其特征在于，所述擴充方法包括如下步驟：

抽取未檢測的數(shù)據(jù)池中的不同材料數(shù)據(jù)對初始訓練數(shù)據(jù)池進行擴充，獲得多個擴充得到的訓練數(shù)據(jù)池及多個訓練得到的基線模型，作為初步篩選結果；所述訓練得到的基線模型為利用擴充得到的訓練數(shù)據(jù)池對基線模型進行訓練獲得的；所述未檢測的數(shù)據(jù)池包括收集得到的未驗證的文獻數(shù)據(jù)；所述初始訓練數(shù)據(jù)池包括實驗數(shù)據(jù)；

從所述初步篩選結果中，選取性能參數(shù)最優(yōu)的訓練得到的基線模型和性能最優(yōu)的訓練得到的基線模型對應的擴充得到的訓練數(shù)據(jù)池作為數(shù)據(jù)集篩選結果。

2.根據(jù)權利要求1所述的基于主動學習的材料數(shù)據(jù)集篩選方法，其特征在于，所述抽取未檢測的數(shù)據(jù)池中的不同材料數(shù)據(jù)對初始訓練數(shù)據(jù)池進行擴充，獲得多個擴充得到的訓練數(shù)據(jù)池及多個訓練得到的基線模型，作為初步篩選結果，具體包括：

滑動窗口j在未檢測的數(shù)據(jù)池中選取材料數(shù)據(jù)，得到多個數(shù)據(jù)候選塊，并將多個所述數(shù)據(jù)候選塊添加至候選集合；

將候選集合中的每個數(shù)據(jù)候選塊分別添加至第m次擴充后的訓練數(shù)據(jù)池中，獲得多個第m+1次擴充后的訓練數(shù)據(jù)池；其中，第0次擴充后的訓練數(shù)據(jù)池為所述初始訓練數(shù)據(jù)池；

利用第m+1次擴充得到的訓練數(shù)據(jù)池對基線模型進行訓練，獲得第m+1次訓練后的基線模型，并計算第m+1次訓練后的基線模型的性能得分，得到n個加入數(shù)據(jù)候選塊后的第m+1次擴充后訓練數(shù)據(jù)池的性能得分；

選取性能得分最高的擴充后的訓練數(shù)據(jù)池，作為第m+1次擴充得到的訓練數(shù)據(jù)池，選取性能得分最高的訓練后的基線模型作為第m+1次訓練得到的基線模型，并將性能得分最高的擴充后的訓練數(shù)據(jù)池中添加的數(shù)據(jù)候選塊從所述候選集合中刪除；

判斷訓練得到的基線模型的性能得分連續(xù)下降的次數(shù)超過第一預設閾值，獲得第一判斷結果；

若所述第一判斷結果表示否，則令m的數(shù)值增加1，清空所述候選集合，調用訓練數(shù)據(jù)池擴充子模塊；

若所述第一判斷結果表示是，則選取性能得分最高的訓練得到的基線模型、性能得分最高的訓練得到的基線模型對應的擴充得到的訓練數(shù)據(jù)池和性能得分，作為窗口j對應的第k個初步篩選結果；

判斷k的數(shù)值是否小于第二預設閾值K，獲得第二判斷結果；

若所述第二判斷結果表示是，則打亂未檢測的數(shù)據(jù)池中材料數(shù)據(jù)的順序，并令k的數(shù)值增加1，令m的數(shù)值為0，清空所述候選集合，返回步驟“滑動窗口j在未檢測的數(shù)據(jù)池中選取材料數(shù)據(jù)，得到多個數(shù)據(jù)候選塊，并將多個所述數(shù)據(jù)候選塊添加至候選集合”；

若所述第二判斷結果表示否，則判斷j的數(shù)值是否小于第三預設閾值J，獲得第三判斷結果；

若所述第三判斷結果表示是，則對窗口j進行更新，獲得窗口j+1，令j的數(shù)值增加1，令m和k的數(shù)值為0，清空所述候選集合，返回步驟“滑動窗口j在未檢測的數(shù)據(jù)池中選取材料數(shù)據(jù)，得到多個數(shù)據(jù)候選塊，并將多個所述數(shù)據(jù)候選塊添加至候選集合”；

若所述第三判斷結果表示否，則輸出K×J個初步篩選結果。

3.根據(jù)權利要求2所述的基于主動學習的材料數(shù)據(jù)集篩選方法，其特征在于，所述滑動窗口j在未檢測的數(shù)據(jù)池中選取材料數(shù)據(jù)，得到多個數(shù)據(jù)候選塊，并將多個所述數(shù)據(jù)候選塊添加至候選集合，之前還包括：

利用初始訓練數(shù)據(jù)池中的材料數(shù)據(jù)對所述基線模型進行初步訓練，獲得初步訓練后的基線模型。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于上海大學，未經(jīng)上海大學許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202210036212.X/1.html，轉載請聲明來源鉆瓜專利網(wǎng)。