[發明專利]基于個性化視覺字典自適應調整的社交圖像檢索方法在審
| 申請號: | 201510111639.1 | 申請日: | 2015-03-13 |
| 公開(公告)號: | CN104699783A | 公開(公告)日: | 2015-06-10 |
| 發明(設計)人: | 牛振興;高新波;宋軍;李潔;王斌;宗汝;鄭昱 | 申請(專利權)人: | 西安電子科技大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 陜西電子工業專利中心 61205 | 代理人: | 王品華;王喜媛 |
| 地址: | 710071*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 個性化 視覺 字典 自適應 調整 社交 圖像 檢索 方法 | ||
技術領域
本發明屬于多媒體信息檢索領域,更進一步涉及一種社交圖像檢索方法,可用于對互聯網中社交圖像搜索。
背景技術
隨著互聯網的高速發展,每天都有數以億計的社交圖像被上傳到各種社交網站,因此,如何對海量的社交圖像進行快速高效的檢索就顯得尤為重要。現有技術對海量圖像檢索的一般步驟是:1)提取通用圖像集的圖像局部特征,建立通用視覺字典;2)提取目標圖像集的圖像局部特征,根據通用視覺字典得到目標圖像的詞袋表示,并創建倒排索引;3)給定一幅查詢圖像,提取其局部特征,得到其詞袋表示,并根據倒排索引計算該圖像與目標圖像的相似度,最后根據相似度對目標圖像進行排序,將排在最前面的圖像作為檢索結果返回。因此,生成較好的視覺字典、減小從圖像局部特征到視覺單詞的量化誤差是提高圖像檢索準確率的關鍵。目前,大多數的圖像檢索方法都是通過考慮圖像局部特征的空間結構信息來減小生成視覺字典的量化誤差。
H.Jégou,M.Douze和C.Schmid在文章“Hamming?embedding?and?weak?geometric?consistency?for?large?scale?image?search”(ECCV,2008)中提出通過引入漢明編碼來減小查詢圖像與目標圖像集的量化誤差。該方法的不足之處是簡單地使用了通用視覺字典、沒有考慮目標圖像集圖像特征的分布特點。
X.Shen,Z.Lin,J.Brandt,S.Avidan和Y.Wu在文章“Object?retrieval?and?localization?with?spatially-constrained?similarity?measure?and?k-NN?reranking”(CVPR,2012)中提出在提取圖像局部特征時,通過考慮圖像局部特征的空間結構信息來減小查詢圖像與目標圖像集的量化誤差。該方法的不足之處也是簡單地使用了通用視覺字典、沒有考慮目標圖像集圖像特征的分布特點。
R.Arandjelovi和A.Zisserman在文章“All?about?VLAD”(CVPR,2013)中提出通過考慮目標圖像集圖像特征的分布特點,通過使用圖像特征與通用視覺單詞間的距離信息來減小查詢圖像與目標圖像集圖像特征的量化誤差。該方法雖然考慮了目標圖像集圖像特征的分布特點,但是該方法并沒有調整通用視覺字典或生成新的視覺字典,由于非判別性視覺單詞的存在,查詢圖像與目標圖像集的量化誤差仍然較大。
發明內容
本發明的目的在于克服上述現有技術的不足,提出基于個性化視覺字典自適應調整的社交圖像檢索方法,以提高圖像檢索的效率和準確率。
實現本發明目的的技術思路是,根據用戶圖像集圖像特征的分布特點對通用視覺字典進行調整,生成該用戶圖像集的個性化視覺字典;并利用該個性化視覺字典對用戶圖像進行量化表示,建立用戶圖像集的個性化倒排索引;在查詢時,根據該個性化視覺字典與倒排索引,完成查詢圖像與用戶圖像間的相似度計算。
根據上述思路。本發明技術步驟包括如下:
(1)在互聯網上抓取Flickr網站的N幅圖像作為通用圖像集,提取每幅圖像的局部特征SIFT,構建通用視覺字典,N>=100萬;
(2)輸入用戶的圖像集,提取每幅圖像的局部特征SIFT,并利用用戶圖像集的局部特征SIFT的分布情況,對通用視覺字典進行調整,生成用戶的個性化視覺字典;
(3)利用用戶的個性化視覺字典,對用戶圖像進行量化表示,建立用戶圖像集的個性化倒排索引;
(4)根據用戶的個性化視覺字典與倒排索引,完成查詢圖像的檢索:
(4a)根據用戶的個性化視覺字典,對查詢圖像進行量化表示;
(4b)計算查詢圖像與用戶圖像之間的相似度,根據相似度對用戶圖像集進行排序,將排在最前面的圖像的索引值作為檢索結果返回。
本發明由于考慮了目標圖像集圖像特征的分布特點,對通用視覺字典進行自適應調整,生成用戶的個性化視覺字典。因此,可以有效減小從圖像局部特征到視覺單詞的量化誤差,提高了圖像檢索的準確率。
附圖說明
圖1為本發明的實現流程圖。
具體實施方式
下面結合附圖1,對本發明實現的步驟作進一步的詳細描述。
步驟1,在互聯網上抓取Flickr網站的N幅圖像作為通用圖像集,提取每幅圖像的局部特征SIFT,構建通用視覺字典。
(1a)通過調用Flickr網站公開的應用程序編程接口抓取N幅圖像作為通用圖像集;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安電子科技大學;,未經西安電子科技大學;許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510111639.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種論文相似度檢測方法
- 下一篇:一種對象編號的生成方法和裝置





