[發明專利]基于優化的視覺詞典與自適應軟分配的圖像檢索方法在審
| 申請號: | 201810191947.3 | 申請日: | 2018-03-08 |
| 公開(公告)號: | CN108427745A | 公開(公告)日: | 2018-08-21 |
| 發明(設計)人: | 李澤超;劉卉 | 申請(專利權)人: | 南京理工大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06K9/62 |
| 代理公司: | 南京理工大學專利中心 32203 | 代理人: | 朱寶慶 |
| 地址: | 210094 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 視覺詞典 自適應 圖像檢索 聚類 分配 優化 圖像 相似性距離 單一特征 技術獲得 檢索結果 局部特征 排序結果 視覺單詞 特征表示 特征計算 提取圖像 圖像序列 壓縮編碼 中心點 類簇 維度 融合 | ||
本發明提供了一種基于優化的視覺詞典與自適應軟分配的圖像檢索方法,包括以下步驟:提取圖像的多種局部特征;對單一特征進行canopy聚類,將獲得的類簇中心作為初始類中心點進行K?means聚類,得到初始視覺詞典;對初始視覺詞典中的視覺單詞進行局部維度的壓縮編碼,獲得優化后的視覺詞典;采用自適應地軟分配技術獲得圖像最終的特征表示;融合多特征計算圖像間的相似性距離,根據距離的排序結果獲得檢索結果圖像序列。
技術領域
本發明涉及一種圖像檢索技術,特別是一種基于優化的視覺詞典與自適應軟分配的圖像檢索方法。
背景技術
本發明是基于改進的Bag-of-features(BoF)圖像表示模型提出的圖像檢索框架,重點包括:在由無監督學習獲得視覺詞典的基礎上,融入改進的乘積量化技術對已經具有一定相異性的視覺詞典的局部維度進行壓縮編碼,增加視覺單詞的判別力;局部特征量化階段采用自適應軟分配技術構造具有判別力的圖像表示;最后是局部特征和全局特征的融合策略。
BoF模型通過將局部描述子量化到各個視覺單詞上,極大地減少了描述符的數量,解決了計算復雜度高和時耗問題。基于BoF模型的圖像檢索的主要步驟有:1)選擇方法來檢測關鍵點并提取關鍵點周圍的局部特征塊;2)將局部描述子量化到視覺單詞。這個階段由生成視覺詞典和局部描述符量化兩個步驟構成;3)索引化數據和檢索,檢索的常用方法是依賴于倒排索引,其中每個視覺單詞都有一個索引位,該索引指示包含它的圖像與權重。
傳統的BoF模型通常采用無監督學習的方式構造視覺詞典,如經典的K-Means聚類、層次聚類、FCM聚類、譜聚類等。類效果好壞取決于聚類算法并且直接影響到特征量化的效果和檢索結果。對與給定的n個特征向量,K-Means算法將它們劃分為k個聚類,使得各個聚類的中心點盡可能的相互分離,同一個聚類中的特征擁有較高的相似度,不同聚類中的特征相似度低。FCM算法是對K-Means硬性劃分方式的一種改進,它將n個特征向量劃分為c個模糊組,求得每個模糊組的類簇中心點,滿足非相似指標函數值最小化。譜聚類的基本思想是利用特征點構造它們的無向權重圖,用一個鄰接矩陣表示,邊的權值既是特征點間的相似度值,任務是將無向權重圖分割成多個最優子圖,每個最優子圖中的特征點盡可能的相近,而不同最優子圖之間的特征點要相互分離,從而實現聚類的目標。
構建優化的視覺詞典之后,局部特征需要量化到各個視覺單詞獲得BoF模型下的圖像特征表示。傳統的方法是將圖像的局部特征量化到一個視覺單詞上,既是所謂的硬分配(HardAssignment,HA),并對每個視覺單詞出現的次數進行計數,最終形成一個k維的頻率直方圖描述子。這種方法忽略了視覺單詞間的相似性與相異性,限制了BoF模型對圖像內容的表達能力。
Philbin等人提出了軟分配的方法來構建視覺單詞統計直方圖,將圖像的每個局部特征映射到多個視覺單詞上;Guo等人首先對視覺詞典的規模進行了優化,然后比較了HA與軟分配(SoftAssignment,SA)的性能,得到了SA相較HQ性能更優的結論。軟分配確實能夠減小局部特征量化到視覺單詞的過程中引發的量化誤差,增強視覺詞典的判別力,進一步提高圖像檢索準確率。然而以上提及的方法在特征映射到視覺單詞時都采用了固定映射數目,這樣很可能導致許多非歧義性的局部特征也不得不映射到指定個數的視覺單詞上,盡管與這些視覺單詞差異性很大。這樣既造成了信息冗余也降低了視覺單詞的判別力。人工地指定不同的分配數目也是不可取的,一般特征集的數據量級很高,人往往不能客觀地判斷正確的分配數目,這么做的效果往往還及不上HA(HardAssignment)。
發明內容
本發明的目的在于提供一種基于優化的視覺詞典與自適應軟分配的圖像檢索方法,提高圖像檢索準確率,改善圖像檢索的效果。
實現本發明目的的技術方案為:一種基于優化的視覺詞典與自適應軟分配的圖像檢索方法,其特征在于,包括以下步驟:
步驟1,提取圖像的多種局部特征;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京理工大學,未經南京理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810191947.3/2.html,轉載請聲明來源鉆瓜專利網。





