[發明專利]基于圖像自編碼的神經網絡特征學習方法有效
| 申請號: | 201710271606.2 | 申請日: | 2017-04-24 |
| 公開(公告)號: | CN107122809B | 公開(公告)日: | 2020-04-28 |
| 發明(設計)人: | 段立娟;恩擎;苗軍;喬元華 | 申請(專利權)人: | 北京工業大學 |
| 主分類號: | G06K9/66 | 分類號: | G06K9/66;G06K9/46;G06N3/08;G06F16/583 |
| 代理公司: | 北京思海天達知識產權代理有限公司 11203 | 代理人: | 沈波 |
| 地址: | 100124 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 圖像 編碼 神經網絡 特征 學習方法 | ||
本發明公開了基于圖像自編碼的神經網絡特征學習方法,屬于特征學習和圖像檢索技術領域。首先通過多標簽圖像數據集的分割標簽構造訓練圖像集對應的分割訓練圖像集,然后初始化卷積神經網絡和自編碼神經網絡的權重,使用隨機梯度下降法訓練自編碼神經網絡,提取每張訓練樣本對應的分割圖像的隱含變量并進行歸一化。隨后,使用該隱含變量作為訓練集原始圖像對應的訓練目標,訓練卷積神經網絡,并提取測試集合圖像庫中的每幅圖像對應的特征向量,通過計算查詢圖像和圖像庫中每幅圖像的特征向量間的歐式距離,并將距離按從小到大的順序排列,得到相似圖像檢索結果。本發明使訓練出的神經網絡提取的特征在多標簽檢索任務上取得了更加優秀的檢索效果。
技術領域
本發明涉及深度學習領域和圖像檢索領域,尤其是涉及到圖像檢索中的特征表達方法,該方法能夠在多標簽數據集上得到更加準確的相似圖像。
背景技術
隨著多媒體和網絡技術的發展,圖像作為人們生活狀態最直觀的表達方式,在人們生活中扮演著越來越重要的角色。大部分圖像都包含了豐富的語義信息,如何在現實生活中找到用戶需求的圖像是所面臨的一個難題和挑戰。出色的特征表達不僅能夠表示圖像的類別信息,更能夠捕捉到圖像的相關語義信息。大量的圖像信息被采集利用,然而將圖像處理與計算機視覺技術相結合,提取圖像中有效的語意表達是現在計算機視覺領域的重中之重。但是大量的圖像出現在給我們帶來便利的同時,也會帶來很多問題,比如如何有效的在大規模圖像庫中檢索到符合用戶語意的圖像以及如何更好的將這些圖像加以利用,以便于用戶有效率、快速的找到所需的圖像。基于內容的圖像檢索在過去一些年在相關領域進行了廣泛的研究,并取得了很多有廣泛利用價值的成果。主要是使用特征向量作為對圖片的內容表達,這樣每幅圖都用一個特征向量來表示這張圖片。在進行檢索的時候就是使用表示圖片的特征向量的距離來度量兩張圖片的相似度。可以很容易看出,圖像識別的關鍵在于特征表達。基于內容的圖像檢索因為其廣泛的可用性以及準確性,現在已經被應用到了很多實際的場景中。目前大量的互聯網公司紛紛投入巨資加入到圖像檢索的研究中,都提出了通過輸入圖像搜索對應語意圖像的功能,這也意味著該領域逐漸成為研究主流。圖像檢索具有高的應用價值,在知識產權方面可以通過該技術嚴格審查文檔內容的相似程度;在醫學領域可以通過該技術可以幫助醫生進行醫療診斷,達到輔助治療的目的;在安防方面可以通過匹配應用幫助公安機關實施犯罪分子抓捕,鎖定目標等工作。
為了提取更具有語義的圖像特征表達,很多研究人員使用深度卷積神經網絡提取特征代替原來的手工特征,并將之應用到圖像檢索領域后成為了目前最為流行和有效的特征表達技術。卷積神經網絡是人工神經網絡的一種,已成為當前語音分析和圖像識別領域的研究熱點。它的權值共享網絡結構使之更類似于生物神經網絡,降低了網絡模型的復雜度,減少了權值的數量。該優點在網絡的輸入是多維圖像時表現的更為明顯,使圖像可以直接作為網絡的輸入,避免了傳統識別算法中復雜的特征提取和數據重建過程。卷積網絡是為識別二維形狀而特殊設計的一個多層感知器,這種網絡結構對平移、比例縮放、傾斜或者共他形式的變形具有高度不變性。深度卷積神經網絡在訓練時通過其自頂向下的監督或非監督學習過程,使得神經網絡能夠分層對輸入信息進行表達,自底向上的信息逐層迭代抽象,這種分層表達的思想,從最初的像素級別特征,抽象成為邊緣信息,再抽象成為物體部件信息,最后抽象成為物體。深度學習由于其多層次的抽象性,使得它優于其他傳統特征提取算法。所以深度神經網絡可以通過相對簡單的表達方法來表示復雜的函數關系,深度學習就是一種特征學習方法,把原始數據通過一些簡單的但是非線性的模型轉變成為更高層次的,更加抽象的表達。通過足夠多的轉換的組合,非常復雜的函數也可以被學習。對于分類任務,高層次的表達能夠強化輸入數據的區分能力方面,同時削弱不相關因素。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京工業大學,未經北京工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710271606.2/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





