[發(fā)明專利]基于互信息增強的自監(jiān)督新穎性檢測方法在審
| 申請?zhí)枺?/td> | 202110908117.X | 申請日: | 2021-08-09 |
| 公開(公告)號: | CN113592016A | 公開(公告)日: | 2021-11-02 |
| 發(fā)明(設(shè)計)人: | 何鳴;孫柳;張政超;王念濱;王紅濱;周連科;王勇 | 申請(專利權(quán))人: | 哈爾濱工程大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 哈爾濱市松花江專利商標事務(wù)所 23109 | 代理人: | 岳泉清 |
| 地址: | 150001 黑龍江*** | 國省代碼: | 黑龍江;23 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 互信 增強 監(jiān)督 新穎性 檢測 方法 | ||
1.基于互信息增強的自監(jiān)督新穎性檢測方法,其特征在于所述方法具體過程為:將待檢測的圖像輸入到訓練好的自監(jiān)督新穎性檢測模型的自編碼器網(wǎng)絡(luò)中進行新穎性檢測,獲得檢測結(jié)果;
所述自監(jiān)督新穎性檢測模型包括:自編碼器網(wǎng)絡(luò)、隱鑒別器Dz、鑒別器Dx、分類器Q;
所述自編碼器網(wǎng)絡(luò)包括:生成器G和編碼器E,所述編碼器E用于將待檢測圖像轉(zhuǎn)化為在潛在空間中對應(yīng)的隱向量;所述生成器用于將隱向量轉(zhuǎn)化為重構(gòu)的圖像;
所述隱鑒別器Dz包括:3層全連接層,用于與編碼器E進行對抗訓練,使得潛在空間的分布近似于標準高斯分布
所述鑒別器Dx用于與生成器G進行對抗訓練,使得生成器可以更好的生成類內(nèi)樣本;
所述分類器Q用于對生成器生成的圖像進行分類;
所述潛在空間是隱向量組成的空間,也就是編碼器和生成器中間的空間。
2.根據(jù)權(quán)利要求1所述的基于互信息增強的自監(jiān)督新穎性檢測方法,其特征在于:所述訓練好的自監(jiān)督新穎性檢測模型,通過以下方式獲得:
步驟一、獲取多類目標圖像數(shù)據(jù)集,并將數(shù)據(jù)集劃分訓練集和測試集;
所述訓練集為類內(nèi)圖像數(shù)據(jù)一部分;
所述測試集包括:另一部分類內(nèi)圖像數(shù)據(jù)以及類外圖像數(shù)據(jù);
所述類內(nèi)圖像數(shù)據(jù)為獲取的多類目標圖像數(shù)據(jù)集中的已知類,其中訓練時每次僅將一個類視為已知類;
所述類外圖像數(shù)據(jù)為獲取的多類目標圖像數(shù)據(jù)集中的未知類;
步驟二、對步驟一獲得的訓練集中的圖像數(shù)據(jù)進行數(shù)據(jù)增強處理,獲得增強后的訓練集,并將增強后的訓練集中的圖像數(shù)據(jù)輸入到編碼器中獲得增強圖像數(shù)據(jù)在潛在空間中對應(yīng)的隱向量;
步驟三、構(gòu)建自監(jiān)督新穎性檢測模型,并利用增強后的訓練集訓練自監(jiān)督新穎性檢測模型,獲得訓練好的自監(jiān)督新穎性檢測模型;
步驟四、將測試集輸入到自編碼器網(wǎng)絡(luò)中測試自監(jiān)督新穎性檢測模型,獲得準確率大于預(yù)設(shè)準確率閾值的自監(jiān)督新穎性檢測模型。
3.根據(jù)權(quán)利要求2所述的基于互信息增強的自監(jiān)督新穎性檢測方法,其特征在于:所述步驟一中獲取多類目標圖像數(shù)據(jù)集,并將數(shù)據(jù)集劃分訓練集和測試集,還可以通過以下方式劃分訓練集和測試集:
所述訓練集為數(shù)據(jù)集網(wǎng)站下載的訓練集中全部類內(nèi)圖像數(shù)據(jù);
所述測試集為數(shù)據(jù)官網(wǎng)站下載的測試集。
4.根據(jù)權(quán)利要求2所述的基于互信息增強的自監(jiān)督新穎性檢測方法,其特征在于:所述步驟二中對步驟一獲得的訓練集中的圖像數(shù)據(jù)進行數(shù)據(jù)增強處理,獲取增強后的訓練集,包括以下步驟:
步驟二一、定義k個離散的幾何變換
其中,t(.|y)是對訓練集中的類內(nèi)圖像數(shù)據(jù)進行標簽y的幾何變換,k為幾何變換的個數(shù),y是訓練集中圖像數(shù)據(jù)的標簽,y∈[1,k];
步驟二二、獲取增強后的訓練集中的類內(nèi)圖像數(shù)據(jù)的集合:
t(X|y)=Rot(X,(y-1)*90) (1)
其中,t(X|y)是增強后的訓練集中的類內(nèi)圖像數(shù)據(jù)的集合,Rot(img,Angle)表示對圖像Img進行中心旋轉(zhuǎn)操作,Angle是旋轉(zhuǎn)角度。
5.根據(jù)權(quán)利要求4所述的基于互信息增強的自監(jiān)督新穎性檢測方法,其特征在于:所述步驟二中獲取的增強圖像數(shù)據(jù)在潛在空間中對應(yīng)的隱向量為z=E(Xy);
其中,Xy=t(X|y)是增強后的類內(nèi)圖像數(shù)據(jù)集,E(·)是編碼器輸出的數(shù)據(jù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于哈爾濱工程大學,未經(jīng)哈爾濱工程大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110908117.X/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標記或含有代碼標記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 在即時通信中提供即時監(jiān)督功能的方法及系統(tǒng)
- 一種監(jiān)督事件的生成裝置
- 一種資產(chǎn)托管監(jiān)督任務(wù)的處理方法及裝置
- 一種監(jiān)督方法及裝置
- 基于自監(jiān)督學習的標簽比例學習模型的訓練方法和設(shè)備
- 一種衛(wèi)生監(jiān)督對象尋址方法、電子設(shè)備及存儲介質(zhì)
- 一種機器人表情調(diào)用方法和家用機器人
- 計算機視覺訓練系統(tǒng)和用于訓練計算機視覺系統(tǒng)的方法
- 一種基于廠區(qū)智能管理系統(tǒng)的工廠設(shè)備監(jiān)督系統(tǒng)
- 信息化綜合監(jiān)督系統(tǒng)及方法





