[發(fā)明專利]用于搜索圖像的方法和裝置以及用于執(zhí)行該方法的計算機可讀記錄介質(zhì)有效
| 申請?zhí)枺?/td> | 201280067115.1 | 申請日: | 2012-11-12 |
| 公開(公告)號: | CN104094255B | 公開(公告)日: | 2017-11-17 |
| 發(fā)明(設(shè)計)人: | T-H·金;M·樸;S·崔 | 申請(專利權(quán))人: | 英特爾公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06K9/72 |
| 代理公司: | 上海專利商標事務(wù)所有限公司31100 | 代理人: | 張東梅 |
| 地址: | 美國加利*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 搜索 圖像 方法 裝置 以及 執(zhí)行 計算機 可讀 記錄 介質(zhì) | ||
技術(shù)領(lǐng)域
本公開內(nèi)容涉及圖像搜索方法和裝置以及非暫態(tài)計算機可讀記錄介質(zhì),其用于通過以下增強圖像搜索的精度:在輸入圖像的特征對應(yīng)于特定單詞或特定二進制碼時,不僅從對應(yīng)于數(shù)據(jù)庫中的特定單詞或特定二進制碼的第一組圖像、而且也從對應(yīng)于鄰近單詞或鄰近二進制碼(該鄰近單詞或鄰近二進制碼靠近對應(yīng)于特定單詞或特定二進制碼的第一組圖像)的第二組圖像,搜索具有與輸入圖像的特征相同或相似的特征的圖像。
背景技術(shù)
在文檔搜索中,文檔可以被表示為從特定詞表中所選擇的單詞的頻率。基于關(guān)于這種頻率的比較衡量在文檔之間的相似性。
類似地,在圖像搜索中,圖像被表示成從特定的視覺詞表選擇的視覺單詞的頻率?;陉P(guān)于這種頻率的比較衡量在圖像之間的相似性。
作為示例,圖像1、2和3中的每一個具有三個特征,以使得圖像1的特征分別對應(yīng)于單詞“a”、“b”、“c”,圖像2的特征分別對應(yīng)于單詞“a”、“c”、“d”,且圖像3的特征分別對應(yīng)于單詞“a”、“d”、“e”。在這種情況中,在圖像1和圖像2之間的相似性頻率是2,且在圖像1和圖像3之間的相似性頻率是1。
然而,不同于文本文檔,由于噪聲、拍攝角度等等,圖像的視覺單詞頻繁地、微妙地改變。即,應(yīng)被表示成單詞“a”的特征例如可以被表示成單詞“e”,該單詞“e”靠近單詞“a”。在這種情況中,僅從對應(yīng)于數(shù)據(jù)庫中的單詞“e”的標識的圖像中搜索具有相同或相似的特征的至少一個圖像。因而,存在降低搜索精度的問題。
例如,在Josef Sivic和Andrew Zisserman在2003年“IEEE International Conference on Computer Vision(IEEE計算機視覺國際會議)”發(fā)表的標題為“Video Google:A Text Retrieval Approach to Object Matching in Videos(視頻谷歌:視頻中的對象匹配的文本檢索方法)”的論文中公開的、使用視覺單詞搜索圖像的技術(shù),具有以上所描述的問題。
發(fā)明內(nèi)容
技術(shù)問題
本公開內(nèi)容的目標是解決以上所描述的問題。
另外,本公開內(nèi)容的另一目標是增強圖像搜索的精度??梢酝ㄟ^以下實現(xiàn)這種目標:在輸入圖像的特征分別對應(yīng)于特定單詞或特定二進制碼時,不僅從對應(yīng)于數(shù)據(jù)庫中的特定單詞或特定二進制碼的第一組圖像、而且也從對應(yīng)于靠近第一組圖像的單詞或二進制碼的第二組圖像搜索具有與輸入圖像的特征相同或相似的特征的圖像。
技術(shù)解決方案
用于實現(xiàn)以上目標的本公開內(nèi)容的代表性配置如下所示。
根據(jù)本公開內(nèi)容的一個方面,一種圖像搜索方法包括:(a)由圖像搜索裝置獲取輸入圖像的特征;以及(b)由圖像搜索裝置獲取相應(yīng)特征所對應(yīng)的單詞和靠近特征所對應(yīng)的相應(yīng)單詞的鄰近單詞。在可視特征空間中所包括的多個單詞單元中的第一單詞單元被指派給一個單詞時,鄰近單詞是被指派給所述多個單詞單元的至少一個第二單詞單元的單詞,第二單詞單元靠近被指派給該單詞的第一單詞單元。所述多個單詞單元被指派給不同的單詞,并且在離該單詞的預(yù)定距離內(nèi)的至少一個單詞被指定為鄰近單詞。該方法還包括(c)基于與對應(yīng)于單詞的第一組圖像相關(guān)聯(lián)的信息以及與對應(yīng)于鄰近單詞的第二組圖像相關(guān)聯(lián)的信息,由圖像搜索裝置搜索與輸入圖像相同或相似的圖像,與第一組和第二組圖像相關(guān)聯(lián)的信息被存儲在數(shù)據(jù)庫中。
根據(jù)本公開內(nèi)容的一些其他方面,提供一種圖像搜索方法,其包括:(a)由圖像搜索裝置獲取輸入圖像的特征;以及(b)由圖像搜索裝置獲取相應(yīng)特征分別對應(yīng)于的二進制代碼。該方法還包括(c)基于與對應(yīng)于二進制代碼的第一組圖像相關(guān)聯(lián)的信息以及關(guān)于對應(yīng)于鄰近二進制代碼(該鄰近二進制代碼靠近對應(yīng)于第一組圖像的二進制代碼且包括關(guān)于到該二進制碼的距離的信息)的第二組圖像的信息,由圖像搜索裝置搜索與輸入圖像相同或相似的圖像,關(guān)于第一組和第二組圖像的信息被存儲在數(shù)據(jù)庫中。在可視特征空間中的多個單詞單元中的第一單詞單元被指派給二進制代碼時,鄰近二進制代碼被指派給所述多個單詞單元中的至少一個的第二單詞單元,第二單詞單元靠近第一單詞單元且包括關(guān)于到第一單詞單元的距離的信息。所述多個單詞單元可以被指派給不同的二進制代碼,并且在離該單詞的預(yù)定距離內(nèi)的至少一個單詞可以被指定為鄰近單詞。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于英特爾公司,未經(jīng)英特爾公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201280067115.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





