[發明專利]一種基于元學習的目標模型與主動查詢策略推薦方法在審
| 申請號: | 202110797847.7 | 申請日: | 2021-07-14 |
| 公開(公告)號: | CN113486058A | 公開(公告)日: | 2021-10-08 |
| 發明(設計)人: | 唐英鵬;黃圣君 | 申請(專利權)人: | 南京市九一數據技術有限公司 |
| 主分類號: | G06F16/2453 | 分類號: | G06F16/2453;G06N3/08 |
| 代理公司: | 北京華沛德權律師事務所 11302 | 代理人: | 馬苗苗 |
| 地址: | 211100 江蘇省南京市鋪崗街5*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 學習 目標 模型 主動 查詢 策略 推薦 方法 | ||
1.一種基于元學習的目標模型與主動查詢策略推薦方法,其特征在于,具體包括以下步驟:
步驟1:給定一個候選算法集合及一個主動查詢策略集合收集一批公開機器學習數據集作為元學習數據;在上模擬主動學習過程,獲得每種候選模型-查詢策略組合的性能;
步驟2:對每個數據集的所有候選模型-查詢策略組合提取得到元特征,并對步驟(一)獲得的每種組合的性能進行排序;初始化一個神經網絡模型f作為元學習模型;采用孿生網絡(Siamese Network)的訓練方式,對網絡輸入來自兩個不同數據集的相同模型-查詢策略對的特征向量,令其預測它們排序的差值;
步驟3:在步驟2訓練得到的網絡權重基礎上,將每種組合的特征作為輸入,其排序值作為標記,對模型f進行優化;
步驟4:對于新數據集,采用步驟2的方式對其提取元特征,并將所有候選模型-查詢策略組合輸入模型預測其排序值,將預測值最大的模型-查詢策略組合輸出,作為新數據集的目標模型與主動查詢策略推薦。
2.根據權利要求1所述一種基于元學習的目標模型與主動查詢策略推薦方法,其特征在于,所述步驟1)中元學習數據收集的具體方法為:
令i,j,k分別為數據集、候選算法、查詢策略的下標;在每個數據集Di上,分別對候選算法集合中的每個算法Aj進行超參優化,獲得每個候選算法的最佳超參組合基于找到的超參組合,在每個數據集上模擬主動學習過程,即劃分一部分數據作為初始標記集合,一部分數據作為測試集合,剩余數據作為未標記集合,在此設置上運行中的每個主動學習算法,進而得到每個最佳超參組合與每個候選查詢策略對應的性能其中,perf(·)為性能度量函數,如學習曲線的均值等。
3.根據權利要求1所述一種基于元學習的目標模型與主動查詢策略推薦方法,其特征在于,所述步驟2)中元特征提取的具體方法為:
對每個數據集Di提取得到元特征Mi,對每種候選算法與查詢策略對(Aj,Sk)進行one-hot編碼,將其與元特征拼接,得到每種組合的特征表示Fijk=[Mi,onehot(Aj),onehot(Sk)];
具體地,元特征Mi的提取方法為:由于模擬主動學習場景,數據集存在少量已標注樣本,及大量未標注樣本;這里本發明首先應用了現有的自動半監督學習的元特征設計方法,對數據集本身提取得到特征然后,考慮到主動學習任務的特性,本發明進一步加入基于候選模型計算得到的未標記數據的信息量值;具體地,利用每個候選模型令其在標記集合上訓練,對未標記數據進行概率預測,并計算預測向量的信息熵,作為信息量指標;取每個候選模型對未標記數據算得的信息量的每10位分位數(percentile)組成10維向量最后,將它們拼接得到元特征其中為集合的大小;
所述步驟2的模型f預訓練方法為:隨機取來自兩個不同數據集的相同模型-查詢策略組合的特征向量(Fijk,Fi'jk),i≠i',計算它們在各自數據集內的排序的差的平方并作為預測標記;這里,的具體含義為候選算法j-查詢策略k的組合在數據集i上的性能表現處于所有候選算法-查詢策略組合中的排名;待模型訓練到收斂時,保存模型參數。
4.根據權利要求1所述一種基于元學習的目標模型與主動查詢策略推薦方法,其特征在于,所述步驟3)中預測目標模型-查詢策略組合性能的模型訓練方法為:
在步驟2訓練得到的網絡權重基礎上,對其進行微調;模型f的輸入為單個候選算法-查詢策略組合的特征向量Fijk,預測標記為待模型f訓練到收斂時,保存模型參數。
5.根據權利要求1所述一種基于元學習的目標模型與主動查詢策略推薦方法,其特征在于,所述步驟4)中對新數據集預測目標模型與查詢策略的具體方法為:
對新數據集采用步驟(二)的方式對其提取元特征Mne(,并將所有候選模型-查詢策略組合的one-hot編碼分別于元特征拼接[Mnew,onehot(Aj),onehot(Sk)]輸入模型f,并獲得其預測值將預測值最大的候選模型-查詢策略組合輸出
作為新數據集的目標模型與主動查詢策略推薦。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京市九一數據技術有限公司,未經南京市九一數據技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110797847.7/1.html,轉載請聲明來源鉆瓜專利網。





