[發明專利]增強圖像分類模型噪聲魯棒性的方法和裝置在審
| 申請號: | 201910296090.6 | 申請日: | 2019-04-12 |
| 公開(公告)號: | CN110070505A | 公開(公告)日: | 2019-07-30 |
| 發明(設計)人: | 趙俊杰 | 申請(專利權)人: | 北京邁格威科技有限公司 |
| 主分類號: | G06T5/00 | 分類號: | G06T5/00;G06K9/62 |
| 代理公司: | 北京鉦霖知識產權代理有限公司 11722 | 代理人: | 李志新;李靜波 |
| 地址: | 100190 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 噪聲圖 分類模型 增強圖像 魯棒性 噪聲 噪聲魯棒性 圖像分類模型 方法和裝置 特征提取步驟 損失計算 特征提取 | ||
1.一種增強圖像分類模型噪聲魯棒性的方法,其中,包括:
獲取原圖步驟,獲取原圖;
獲取噪聲圖步驟,獲取在所述原圖基礎上帶有噪聲的噪聲圖;
特征提取步驟,通過圖像分類模型,對所述原圖和所述噪聲圖進行特征提取,得到原圖特征和噪聲圖特征;
損失計算步驟,基于所述原圖特征和所述噪聲圖特征,計算所述原圖特征和所述噪聲圖特征之間的噪聲距離,并計算魯棒性損失;
約束步驟,基于所述魯棒性損失,約束所述原圖特征與所述噪聲圖特征之間的所述噪聲距離,得到訓練后的圖像分類模型。
2.根據權利要求1所述的方法,其中,所述獲取噪聲圖步驟還包括,通過對所述原圖進行圖像變化,得到所述噪聲圖。
3.根據權利要求2所述的方法,其中,所述圖像變化采用平移、旋轉、縮放、仿射變換、高斯模糊、運動模糊、椒鹽噪聲中的一種或多種方式。
4.根據權利要求1所述的方法,其中,所述損失計算步驟包括,基于所述原圖特征和所述噪聲圖特征之間的所述噪聲距離,選取與所述原圖特征之間的所述噪聲距離大于預設值的所述噪聲圖特征作為樣本特征、或通過排序選取與所述原圖特征之間的所述噪聲距離最遠的一個或多個噪聲圖特征作為樣本特征,并基于所述樣本特征計算所述魯棒性損失。
5.根據權利要求4所述的方法,其中,所述損失計算步驟還包括,根據曼哈頓距離、歐式距離、相對熵或交叉熵計算所述噪聲距離。
6.根據權利要求1至5任一項的所述的方法,其中,
所述損失計算步驟還包括,基于所述原圖特征和標準特征之間的標準距離,計算分類損失;
所述約束步驟還包括,基于所述分類損失,約束所述原圖特征與所述標準特征之間的所述標準距離。
7.一種圖像分類方法,其中,包括:
圖像獲取步驟,獲取待測圖像;
圖像分類步驟,通過圖像分類模型對所述待測圖像進行分類,所述圖像分類模型經過如權利要求1至6中任一項所述的增強圖像分類模型噪聲魯棒性的方法訓練。
8.一種增強圖像分類模型噪聲魯棒性的裝置,其中,包括:
獲取原圖模塊,用于獲取原圖;
獲取噪聲圖模塊,用于獲取在所述原圖基礎上帶有噪聲的噪聲圖;
特征提取模塊,用于通過圖像分類模型,對所述原圖和所述噪聲圖進行特征提取,得到原圖特征和噪聲圖特征;
損失計算模塊,用于基于所述原圖特征和所述噪聲圖特征,計算所述原圖特征和所述噪聲圖特征之間的噪聲距離,并計算魯棒性損失;
約束模塊,用于基于所述魯棒性損失,約束所述原圖特征與所述噪聲圖特征之間的所述噪聲距離,得到訓練后的圖像分類模型。
9.一種圖像分類裝置,其中,包括:
圖像獲取模塊,用于獲取待測圖像;
圖像分類模塊,用于通過圖像分類模型對待測圖像進行分類,所述圖像分類模型經過如權利要求1至6中任一項所述的增強圖像分類模型噪聲魯棒性的方法訓練。
10.一種電子設備,其中,所述電子設備包括:
存儲器,用于存儲指令;以及
處理器,用于調用所述存儲器存儲的指令執行如權利要求1至6中任一項所述的增強圖像分類模型噪聲魯棒性的方法或如權利要求7所述的圖像分類方法。
11.一種計算機可讀存儲介質,其中存儲有指令,所述指令被處理器執行時,執行如權利要求1至6中任一項所述的增強圖像分類模型噪聲魯棒性的方法或如權利要求7所述的圖像分類方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京邁格威科技有限公司,未經北京邁格威科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910296090.6/1.html,轉載請聲明來源鉆瓜專利網。





