[發(fā)明專利]基于相關(guān)反饋和Bag-of-Features的圖像檢索系統(tǒng)及方法有效
| 申請?zhí)枺?/td> | 201310330706.X | 申請日: | 2013-07-31 |
| 公開(公告)號: | CN103440262A | 公開(公告)日: | 2013-12-11 |
| 發(fā)明(設(shè)計)人: | 羅笑南;姜濤;肖劍 | 申請(專利權(quán))人: | 東莞中山大學(xué)研究院;中山大學(xué) |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06K9/46 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 523808 廣東省*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 相關(guān) 反饋 bag of features 圖像 檢索系統(tǒng) 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及計算機(jī)領(lǐng)域,具體涉及一種基于相關(guān)反饋和Bag-of-Features的圖像檢索方法。
背景技術(shù)
隨著信息科技的發(fā)展,各個領(lǐng)域各種圖像越來越多,如何從大量圖像數(shù)據(jù)中快速而準(zhǔn)確地檢索出相關(guān)圖像逐漸成為人們的關(guān)注熱點(diǎn)。近些年,在工業(yè)應(yīng)用界和學(xué)術(shù)研究界,大規(guī)模圖像檢索日益受到廣泛重視,不斷提出各種圖像檢索的方法,包括基于文本的圖像檢索、基于分類的圖像檢索等等。
基于文本的圖像檢索沿用了傳統(tǒng)文本檢索技術(shù),回避對圖像可視化元素的分析,而是從圖像名稱、圖像尺寸、壓縮類型、作者、年代等方面標(biāo)引圖像,一般以關(guān)鍵詞來查詢圖像,或者是根據(jù)等級目錄的形式瀏覽查找特定類目下的圖像。另外,圖像所在頁面的主題、圖像的文件名稱、與圖像密切環(huán)繞的文字內(nèi)容、圖像鏈接地址等都被用作為圖像分析的一句,根據(jù)這些文本分析結(jié)果推斷其中圖像的特征。
基于分類的圖像檢索是一種利用圖像分類進(jìn)行檢索的技術(shù)。該技術(shù)需要對數(shù)據(jù)庫中的圖像進(jìn)行明確的分類,并為每個類別選取出最具代表性的一些圖像。用戶輸入一張查詢圖像時,系統(tǒng)將該圖像與數(shù)據(jù)庫中每個類別的代表圖像進(jìn)行相似度量,從而確定該查詢圖像所屬的類別,然后將該類別的所有圖像作為檢索結(jié)果返回給用戶。
基于文本的圖像檢索方法雖然方便快捷,根據(jù)關(guān)鍵字就可以快速查詢到所需圖像,但是該檢索方法完全脫離了圖像的可視化內(nèi)容,僅依靠與其關(guān)聯(lián)的關(guān)鍵字,需要預(yù)先為所有圖像進(jìn)行文本標(biāo)識,并且標(biāo)識的準(zhǔn)確性直接影響檢索的準(zhǔn)確性。而基于分類的圖像檢索方法依賴于數(shù)據(jù)庫中圖像的分類,目前并沒有準(zhǔn)確有效地分類各種圖像。這些傳統(tǒng)圖像檢索方法的弊端日益突出,人們亟待更新更有效地方法,關(guān)于圖像檢索方法的研究繼續(xù)前行。
由于傳統(tǒng)的圖像檢索方法存在各種弊端,已逐漸不能滿足人們的需求。人們提出了一種不同的解決方案:基于內(nèi)容的圖像檢索方法。基于內(nèi)容的圖像檢索是使用圖像的可視特征對圖像進(jìn)行檢索,它提取圖像的低層特征,包括顏色、形狀、紋理等,然后將查詢圖像的低層特征與數(shù)據(jù)庫中的特征進(jìn)行比較,找出與查詢特征相似的圖像返回給用戶。
基于內(nèi)容的圖像檢索方法雖然是脫離了圖像文本標(biāo)注,而對圖像的可視化內(nèi)容進(jìn)行檢索,但是該方法只是提取圖像的顏色、形狀、紋理等低層特征,無法表示圖像的高層語義內(nèi)容,因此檢索結(jié)果往往差強(qiáng)人意。
發(fā)明內(nèi)容
本發(fā)明提供了一種基于相關(guān)反饋和Bag-of-Features的圖像檢索方法,采用Bag-of-Features方式,將每一張圖像看作是一些局部特征的集合,并挑選出圖像庫中的關(guān)鍵特征,然后基于關(guān)鍵特征集合將每一張圖像表示成一個向量,這樣通過向量的比較來實現(xiàn)圖像檢索的目的,這種方式簡潔有效。同時,為了兼顧圖像的高層語義,結(jié)合相關(guān)反饋的方法,讓用戶參與檢索的過程,用戶對每次檢索結(jié)果進(jìn)行正相關(guān)和負(fù)相關(guān)的標(biāo)示,系統(tǒng)根據(jù)用戶的反饋重新調(diào)整檢索參數(shù),以此迭代,最終得到用戶滿意的檢索結(jié)果。
相應(yīng)的,本發(fā)明實施例提供了一種基于相關(guān)反饋和Bag-of-Features的圖像檢索系統(tǒng),包括:
特征提取模塊,用于對圖像進(jìn)行預(yù)處理,提取出每張圖像的局部特征;
特征詞典生成模塊,用于從整個圖像數(shù)據(jù)庫中找出關(guān)鍵性特征,并組成一個詞典集合;
頻率特征向量生成模塊,用于為每張圖像構(gòu)建一個特征向量;
特征加權(quán)模塊,用于為詞典中每個關(guān)鍵特征生成權(quán)重,然后用該權(quán)重乘以頻率特征向量中對應(yīng)的分量,為每張圖像構(gòu)建出帶權(quán)特征向量;
相似性度量模塊,用于計算兩張圖像之間的相似性;
相關(guān)反饋模塊,用于讓用戶參與到檢索過程,在用戶輸入查詢條件后,檢索系統(tǒng)返回查詢結(jié)果,然后用戶對查詢結(jié)果進(jìn)行篩選,認(rèn)為有用的就標(biāo)識成正相關(guān),無用的標(biāo)識成負(fù)相關(guān),系統(tǒng)根據(jù)用戶的反饋,重新調(diào)整查詢條件進(jìn)行檢索,以此循環(huán),直到得到用戶滿意的結(jié)果。
相應(yīng)的,本發(fā)明實施例還提供了一種基于相關(guān)反饋和Bag-of-Features的圖像檢索方法,包括:
步驟一、對每張圖像進(jìn)行特征提取,找出局部特征,并將其用SIFT算子表示;
步驟二、將所有圖像的局部特征集合在一起,采用K-means聚類的方式,生成指定數(shù)量的關(guān)鍵特征,組成特征詞典;
步驟三、對每張圖像,依次將其每個局部特征分配給最近鄰的關(guān)鍵特征,表示關(guān)鍵特征的頻數(shù),這樣基于特征詞典,可以為每張圖像生成一個頻率特征向量;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于東莞中山大學(xué)研究院;中山大學(xué),未經(jīng)東莞中山大學(xué)研究院;中山大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310330706.X/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





