[發明專利]多量化深度二值特征學習方法及裝置有效
| 申請號: | 201710349641.1 | 申請日: | 2017-05-17 |
| 公開(公告)號: | CN107239793B | 公開(公告)日: | 2020-01-17 |
| 發明(設計)人: | 魯繼文;周杰;段岳圻 | 申請(專利權)人: | 清華大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06K9/46;G06K9/38 |
| 代理公司: | 11201 北京清亦華知識產權代理事務所(普通合伙) | 代理人: | 張潤 |
| 地址: | 10008*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 量化結果 圖像 量化 二值編碼 量化誤差 特征學習 提取圖像 學習效率 應用需求 有效解決 二值化 自編碼 網絡 學習 | ||
1.一種多量化深度二值特征學習方法,其特征在于,包括以下步驟:
提取圖像的深度實值特征;
通過K個自編碼網絡對所述圖像的深度實值特征進行多量化,以得到量化結果,其中,整體的損失函數為:
其中,J為待優化目標,X為所求實值特征,為第n張圖片的實值特征在第k個自動編碼器的重構誤差,為第k個自動編碼器的第l層的投影,U為所有實值特征的均值向量,λ1、λ2為不同項的權重;以及
根據所述量化結果對所述圖像的深度實值特征進行二值編碼,以得到圖像的二值特征。
2.根據權利要求1所述的多量化深度二值特征學習方法,其特征在于,所述提取圖像的深度實值特征,進一步包括:
將原始的輸入圖像前傳入深度卷積神經網絡,以在網絡的最后層全連接后得到每一張圖像的深度實值特征;
將所述每一張圖像的深度實值特征傳入降維的全連階層,以得到低維實值特征。
3.根據權利要求1所述的多量化深度二值特征學習方法,其特征在于,所述通過K個自編碼網絡對所述圖像的深度實值特征進行多量化,進一步包括:
通過K個自編碼器對所述圖像的深度實值特征分別進行重構,其中,令每個訓練樣本屬于重構誤差最小的編碼器;
根據第一項損失函數和第二項損失函數,對于每個自編碼器,使用屬于該自編碼器的全部樣本對其進行訓練,以迭代多步后,對于每個樣本使用重構誤差最小的編碼器的編號作為該樣本的量化結果,其中,所述第一項損失函數為最小化K個自編碼網絡的重構誤差,所述第二項損失函數為K個自編碼網絡參數正則化;
根據第二項損失函數和第三項損失函數,對于深度神經網絡的全連接層,使用全部樣本對其進行訓練,直到最大迭代次數,其中,所述第三項損失函數為最大化特征每一維度方差。
4.根據權利要求3所述的多量化深度二值特征學習方法,其特征在于,所述根據所述量化結果對所述圖像的深度實值特征進行二值編碼,進一步包括:
對于所述深度實值特征的每一位,將該位賦值為使得該位重構誤差最小的自編碼器的二進制編號。
5.一種多量化深度二值特征學習裝置,其特征在于,包括:
提取模塊,用于提取圖像的深度實值特征;
多量化模塊,用于通過K個自編碼網絡對所述圖像的深度實值特征進行多量化,以得到量化結果,其中,整體的損失函數為:
其中,J為待優化目標,X為所求實值特征,為第n張圖片的實值特征在第k個自動編碼器的重構誤差,為第k個自動編碼器的第l層的投影,U為所有實值特征的均值向量,λ1、λ2為不同項的權重;以及
編碼模塊,用于根據所述量化結果對所述圖像的深度實值特征進行二值編碼,以得到圖像的二值特征。
6.根據權利要求5所述的多量化深度二值特征學習裝置,其特征在于,所述提取模塊具體用于將原始的輸入圖像前傳入深度卷積神經網絡,以在網絡的最后層全連接后得到每一張圖像的深度實值特征,并且將所述每一張圖像的深度實值特征傳入降維的全連階層,以得到低維實值特征。
7.根據權利要求5所述的多量化深度二值特征學習裝置,其特征在于,所述多量化模塊還用于通過K個自編碼器對所述圖像的深度實值特征分別進行重構,其中,令每個訓練樣本屬于重構誤差最小的編碼器,并且根據第一項損失函數和第二項損失函數,對于每個自編碼器,使用屬于該自編碼器的全部樣本對其進行訓練,以迭代多步后,對于每個樣本使用重構誤差最小的編碼器的編號作為該樣本的量化結果,以及根據第二項損失函數和第三項損失函數,對于深度神經網絡的全連接層,使用全部樣本對其進行訓練,直到最大迭代次數,其中,所述第一項損失函數為最小化K個自編碼網絡的重構誤差,所述第二項損失函數為K個自編碼網絡參數正則化,所述第三項損失函數為最大化特征每一維度方差。
8.根據權利要求7所述的多量化深度二值特征學習裝置,其特征在于,所述編碼模塊還用于對于所述深度實值特征的每一位,將該位賦值為使得該位重構誤差最小的自編碼器的二進制編號。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清華大學,未經清華大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710349641.1/1.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





