[發明專利]基于卷積神經網絡和監督核哈希的目標檢索方法在審
| 申請號: | 201810157751.2 | 申請日: | 2018-02-24 |
| 公開(公告)號: | CN108304573A | 公開(公告)日: | 2018-07-20 |
| 發明(設計)人: | 李弼程;趙永威;朱彩英;陳良浩 | 申請(專利權)人: | 江蘇測聯空間大數據應用研究中心有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06N3/04 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 215000 江蘇省蘇州市高*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 卷積神經網絡 目標檢索 哈希 檢索 圖像數據 哈希碼 監督 哈希函數構造 相似性信息 等價關系 漢明距離 結合訓練 目標函數 圖像索引 圖像特征 網絡結構 訓練圖像 大數據 引入 高階 高維 內積 隱式 學習 分辨 圖像 | ||
本發明涉及檢索方法領域,尤其是基于卷積神經網絡和監督核哈希的目標檢索方法。該檢索方法包括:(1)引入卷積神經網絡對訓練圖像進行學習,利用其特殊網絡結構隱式地學習得到圖像數據的高階表示,生成深層特征;(2)引入增強對線性不可分數據的分辨力的監督核哈希方法,同時利用哈希碼內積與漢明距離的等價關系提出目標函數,并結合訓練圖像的相似性信息對高維圖像特征進行監督學習,并生成哈希碼;(3)利用已訓練好的哈希函數構造圖像索引,實現對大規模圖像數據的檢索。本發明通過基于卷積神經網絡和監督核哈希的目標檢索方法極大地提高了目標檢索效率,增強了在大數據環境下的實用性。
技術領域
本發明涉及檢索方法領域,尤其是基于卷積神經網絡和監督核哈希的目標檢索方法。
背景技術
隨著大數據時代的到來,互聯網視頻圖像資源迅猛增長,如何對大規模視頻、圖像資源中的關注目標進行快速有效地檢索以滿足用戶需求亟待解決。雖然局部特征點的出現,如SIFT(Scale-Invariant Feature Transform)、HOG(Histogram of OrientatedGradients)等在圖像處理領域表現出優良的性能,但是生成這些描述子時固定的編碼步驟使得描述子缺少學習能力,限制了其圖像內容表達能力,難以適應多樣的圖像數據,在一定程度上降低了大規模圖像目標檢索性能。為了得到大量圖像數據的內在隱含關系,生成更具有區分性和代表性的特征,Hinton等學者將深度學習(Deep Learning)應用于圖像處理領域中,為提取更加有效的圖像特征提供了新思路。
深度置信網絡(Deep Belief Network,DBN)頂層采用三階玻爾茲曼機(BoltzmannMachine,BM),將改進的DBN用于三維目標特征提取,該特征對目標旋轉變化具有較高的魯棒性。此外,研究者構建了卷積深度置信網絡(Convolutional Deep Belief Network,CDBN),利用CDBN能從未標注的自然圖像中學習有效的高階特征表示。以及通過在卷積神經網絡(Convolutional Neural Network,CNN)的卷積層和全連接層加入SPP(SpatialPyramid Pooling)層,直接對不同大小圖像進行學習并生成多尺度特征。
但是,深度學習生成的圖像特征維數較高,存在維數災難問題,當圖像數據規模較大時,若采用傳統的最近鄰檢索方法(如R-tree、KD-tree等)進行檢索就會使檢索速度急劇下降,難以適用于大規模數據。為實現對大規模高維圖像數據進行有效檢索,研究者提出了近似最近鄰搜索策略(Approximate Nearest Neighbor,ANN)。其中,哈希技術(Hashing)是解決近似最近鄰檢索問題的主流方法,其思想是利用哈希函數族將高維圖像特征映射到低維空間中,同時使得原空間中距離較近的點映射到低維空間后仍保持較近的距離。LSH及其改進算法構造的哈希函數都是與數據無關的,近年來,研究者們針對如何結合數據特點構造有效、緊致的哈希函數提出了許多算法。譜哈希方法(Spetral Hashing,SH)首先對相似圖的拉普拉斯矩陣特征值和特征向量進行分析,再通過放寬限制條件,將對圖像特征向量編碼問題轉換為拉普拉斯特征圖的降維問題進行求解,該方法依賴數據本身生成索引比隨機產生哈希函數方法達到更高的準確率。但是,無監督的方法并沒有考慮圖像的語義信息,而用戶往往更傾向于檢索結果的語義信息。為此,研究人員提出了半監督哈希方法(Semi-Supervised Hashing,SSH)。在半監督學習方法的基礎上研究者們還提出了一些全監督哈希方法,例如SH(Semantic Hashing)、BRE(Binary Reconstructive Embedding)、MLH(Minimal Loss Hashing)等,全監督哈希方法相比于非監督方法能達到更高的準確率,但是存在優化過程較為復雜、訓練效率低等問題,這嚴重限制了其在大規模數據集上的應用。
發明內容
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于江蘇測聯空間大數據應用研究中心有限公司,未經江蘇測聯空間大數據應用研究中心有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810157751.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種大數據存儲方法和系統
- 下一篇:一種遠程監控計算機內目標文檔的方法





