[發明專利]基于記憶引導的弱監督學習方法、計算機設備和存儲介質在審
| 申請號: | 202110048718.8 | 申請日: | 2021-01-14 |
| 公開(公告)號: | CN112734037A | 公開(公告)日: | 2021-04-30 |
| 發明(設計)人: | 郭雨晨;孫希明;李育卉;戴瓊海 | 申請(專利權)人: | 清華大學 |
| 主分類號: | G06N3/08 | 分類號: | G06N3/08;G06K9/62 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 韓?;?/td> |
| 地址: | 10008*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 記憶 引導 監督 學習方法 計算機 設備 存儲 介質 | ||
1.一種基于記憶引導的弱監督學習方法,其特征在于,包括:
對帶有正確標簽的舊數據集之中的每個舊數據進行編碼處理,以獲得每個舊數據的向量信息,并根據每個舊數據的向量信息和所述每個舊數據的正確標簽訓練一個預測模型;
基于所述每個舊數據的向量信息和所述每個舊數據的正確標簽構建記憶池;其中,所述記憶池內包括多個記憶信息,每個所述記憶信息用于表示數據向量信息與標簽的對應關系;
當學習新數據時,對所述新數據進行編碼處理以獲得所述新數據的向量信息,并從所述記憶池中提取至少部分記憶信息,將所述至少部分記憶信息與所述新數據的向量信息輸入至所述預測模型訓練,得到針對所述新數據的預測標簽;
根據所述至少部分記憶信息獲取參考標簽,并根據所述參考標簽對所述預測標簽進行評判;
將評判結果與所述新數據的向量信息組成一條新記憶信息并存儲至所述記憶池;
不斷重復新數據的學習過程以更新模型參數,直至本批次新數據全部處理完成后輸出分類模型。
2.根據權利要求1所述的方法,其特征在于,所述從所述記憶池中提取至少部分記憶信息,包括:
將所述新數據的向量信息與所述記憶池之中每個所述記憶信息中的數據向量信息進行相似計算;
將相似計算結果滿足相似記憶匹配指標的記憶信息作為所述至少部分記憶信息。
3.根據權利要求2所述的方法,其特征在于,通過以下公式進行相似計算:
dist(xi,mj)=||xi-mj||2
其中,xi表示所述新數據的向量信息,mj表示所述記憶池中第j個記憶信息中的數據向量信息,dist(xi,mj)表示以L2范數計算得到的所述新數據與第j個記憶信息之間的向量相似程度。
4.根據權利要求1所述的方法,其特征在于,當學習新數據時,若所述新數據沒有被標注,則所述預測模型的輸入為所述至少部分記憶信息與待學習的無標簽數據;若所述新數據被標注,則將所述新數據所帶有的標簽暫存,看作無標簽數據,并與所述至少部分記憶信息作為所述預測模型的輸入。
5.根據權利要求4所述的方法,其特征在于,所述根據所述至少部分記憶信息獲取參考標簽,包括:
計算所述預測模型輸入的無標簽數據的向量信息與所述至少部分記憶信息之中各個數據向量信息之間的距離;
將所述各個數據向量信息之間的距離作為所述各個數據向量信息的標簽加權;
根據至少部分記憶信息之中各個數據向量信息對應標簽,以及所述各個數據向量信息的標簽加權,獲取所述參考標簽。
6.根據權利要求4所述的方法,其特征在于,所述將所述至少部分記憶信息與所述新數據的向量信息輸入至所述預測模型訓練,得到針對所述新數據的預測標簽,包括:
對于所述預測模型輸入的無標簽數據進行R次數據增強,得到R個增強數據,并將所述R個增強數據分別通過所述預測模型得到R個預測分類概率;
根據所述至少部分記憶信息獲取參考標簽;
基于銳化函數處理所述R個預測分類概率的平均值和所述參考標簽,得到針對所述新數據的預測標簽。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清華大學,未經清華大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110048718.8/1.html,轉載請聲明來源鉆瓜專利網。





