[發明專利]一種基于有監督超圖離散化圖像二值編碼方法有效
| 申請號: | 201810402753.3 | 申請日: | 2018-04-28 |
| 公開(公告)號: | CN109284411B | 公開(公告)日: | 2022-03-18 |
| 發明(設計)人: | 王軒;張喜;漆舒漢;蔣琳;廖清;姚霖;李曄;關鍵;劉澤超;吳宇琳 | 申請(專利權)人: | 哈爾濱工業大學深圳研究生院 |
| 主分類號: | G06F16/53 | 分類號: | G06F16/53;G06K9/62;G06V10/74;G06V10/764 |
| 代理公司: | 深圳市科吉華烽知識產權事務所(普通合伙) 44248 | 代理人: | 胡玉 |
| 地址: | 518000 廣東省深*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 監督 超圖 離散 圖像 編碼 方法 | ||
本發明涉及圖像數據處理領域,特別涉及一種基于有監督超圖離散化圖像二值編碼方法。該方法包括以下步驟:S1.假設一個由n幅圖像組成訓練集,將訓練集所有樣本通過學習哈希函數映射到漢明空間的二值化哈希碼;S2.定義一個線性多分類模型,采用優化函數對離散化變量進行優化,得出第一目標函數;S3.采用超圖對數據哈希碼之間的距離度量一致性進行約束,得出第二目標函數;S4.整合第一目標函數和第二目標函數,得到完整的目標函數,采用“位循環坐標下降方法”學習哈希碼矩陣,并通過迭代運算優化目標函數。本發明既可以保持數據在原始空間相似性,又能提高檢索的準確率。
技術領域
本發明涉及圖像數據處理領域,特別涉及一種基于有監督超圖離散化圖像二值編碼方法。
背景技術
隨著互聯網的快速發展,互聯網上圖像的數據量呈現出爆炸式的增長。與此同時,迅速增長的圖片資源使得用戶難以在浩如煙海的圖像中找到真正所需要的圖片信息。基于文本的傳統圖像檢索方法是采用人工的手段對圖像標注,利用文字標簽信息進行檢索。但是,隨著圖像數據的快速增加,人工標注圖片太過費力,耗時較長,并帶有主觀偏差,而且有些圖片根本無法用文本信息來進行描述。因此基于內容的圖像檢索(CBIR)便應運而生。
基于內容的圖像檢索(CBIR)核心是利用圖像的可視化特征對圖像進行檢索,典型的CBIR系統,允許用戶輸入一張圖片,以檢索具有相同或者相似內容的圖片。CBIR所面臨的一個基本問題是當特征維度高且數據量非常龐大時,數據存儲空間將隨著特征維度的增加,迅速增加,檢索效率會隨之降低,這種現象稱為“維度災難”。
為了解決這個問題,人們發明了哈希的相關算法,即基于哈希的圖像檢索方法,可以有效解決維度災難帶來檢索效率低等問題。哈希方法引入近似的概念,認為在大規模數據檢索中,用戶更注重的是檢索效率,而對檢索的準確性不做過高的要求。對于大規模數據的檢索,近似的檢索結果就能滿足用戶的檢索需求。從而在解決實際大規模數據檢索問題時,可以合理的犧牲檢索精度,來提高檢索的效率。
基于哈希的圖像檢索方法,尋求在保持原始空間相似性前提下,將高維數據通過哈希函數映射到漢明空間,并保持原始空間的語義相似性,因此可以直接在漢明空間,用漢明距離代替原始空間的歐氏距離行快速檢索,同時還能保持較高的準確性。通過線下學習原始數據的哈希碼,對于新查詢的數據,可以大幅提高其在數據中的檢索速度,滿足實際的檢索需求。
發明內容
本發明提供一種基于有監督超圖離散化圖像二值編碼方法,旨在解決大規模圖像數據的檢索質量和檢索效率問題。
本發明提供一種種基于有監督超圖離散化圖像二值編碼方法,包括以下步驟:
S1.假設一個由n幅圖像組成訓練集,將訓練集所有樣本通過學習哈希函數映射到漢明空間的二值化哈希碼;
S2.定義一個線性多分類模型,采用優化函數對離散化變量進行優化,得出第一目標函數;
S3.采用超圖對數據哈希碼之間的距離度量一致性進行約束,得出第二目標函數;
S4.整合第一目標函數和第二目標函數,得到完整的目標函數,采用“位循環坐標下降方法”學習哈希碼矩陣,并通過迭代運算優化目標函數。
作為本發明的進一步改進,所述步驟S1具體包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈爾濱工業大學深圳研究生院,未經哈爾濱工業大學深圳研究生院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810402753.3/2.html,轉載請聲明來源鉆瓜專利網。





