[發明專利]基于內容的海量圖像檢索方法和系統在審
| 申請號: | 201110348020.4 | 申請日: | 2011-11-07 |
| 公開(公告)號: | CN102508901A | 公開(公告)日: | 2012-06-20 |
| 發明(設計)人: | 陳大煒 | 申請(專利權)人: | 康佳集團股份有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 深圳市君勝知識產權代理事務所 44268 | 代理人: | 王永文;楊宏 |
| 地址: | 518053*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 內容 海量 圖像 檢索 方法 系統 | ||
技術領域
本發明屬于互聯網搜索技術領域,尤其涉及一種基于內容的海量圖像檢索方法和系統。
背景技術
圖像檢索的本質是對圖像特征的提取與基于特征的匹配技術,圖像的特征包括圖像的文本特征、視覺特征,所謂圖像的文本特征是指與圖像相關的文本信息,比如圖像的名稱、對圖像的注解文字等,圖像的視覺特征是指圖像本身所擁有的視覺信息,又可以進一步分為通用的視覺特征和領域特征,如顏色、紋理、形狀等屬于圖像通用特征。
從發展演變歷程來看,根據圖像檢索系統所提取圖像特征可分為兩類,第一類即基于文本的圖像檢索實際上是將圖像檢索轉換為與該圖像對于的文本標識的關鍵字檢索,及在圖像數據存入數據庫時,首先將圖像文件進行人工標注,建立相應的關鍵詞或描述字段,并將圖像信息與該關鍵字建立對應關系,然后用傳統的基于關鍵字的信息方式檢索出與關鍵字匹配的圖像。第二類即基于內容的圖像檢索,即通過以圖找圖的方式進行圖像內容檢索,本質上是通過對圖像的視覺特征信息,特別是顏色、紋理和形狀等。在將圖像保存至數據庫時,首先對圖像進行特征提取,將圖像與其特征信息建立對象關系,用戶在提供源圖像后,搜索系統將對源圖像進行相同的特征提取操作,讓用提取的圖像特征與圖像數據庫的特征進行相似度匹配,最后給出檢索結果。
現有技術中,基于文本的圖像檢索的問題在于圖像檢索的效果實際上取決于圖像人工標注的準確度,如果圖像數據庫中的標注信息與實際用戶的檢索需求關鍵字不匹配,則會導致檢索結果相差甚遠,檢索效率不高。主要原因是,人工標注圖像具有較大的主觀性,不同的人對圖像的描述可能由于理解不同相差很大,而且圖像中蘊含的特征有時很難用文字表達或描述清楚,這個基于文本的圖像搜索應用帶來很大的局限性。而基于內容的圖像檢索的問題在于圖像中蘊含的內容太多,以至于任意一種圖像特征描述方法均不可能做到十分的精確,特征匹配只能就提取的特征本身采用相似性匹配方法進行;這種相似性是由多維特征空間的距離測度定義的(如彩色直方圖查詢),涉及到對象簇的檢索表示方法。對于小型圖像數據庫,可以采用順序瀏覽檢索方法,即在檢索時,將數據庫中存儲的特征與查詢要求的特征作相似性比較,決定哪些圖像是好的匹配,但是對于海量的圖像數據庫來說,這種檢索速度就無法滿足要求,通常還需要進行降維和過濾等操作。
所以現有技術存在不足,需要改進和提高。?
發明內容
本發明的目的在于提供一種基于內容的海量圖像檢索方法和系統,解決了現有技術?對海量圖像檢索所存在的檢索速度慢,檢索過程復雜的問題。
本發明是這樣實現的,一種基于內容的海量圖像檢索方法,其特征在于,所述方法包括如下步驟:
A、???????從互聯網上實時搜集圖像信息,采集所述圖像信息的URL資源鏈接獲取圖像數據,對所述圖像數據進行特征提取,并將聚合的圖像數據描述符編碼保存至數據庫中;?
B、????????獲取用戶輸入的圖像文件并進行特征提取,將提取的所述圖像文件特征描述符與所述數據庫中的圖像數據描述符編碼進行匹配,將誤差最小的若干幅圖像特征結果作為搜索結果,并將對應的圖像URL鏈接返回給用戶?。
其中,所述步驟A具體包括如下步驟:
A1、圖像數據采集單元利用網站爬蟲實時從所述互聯網上搜集所述圖像信息,將采集所述圖像信息的URL資源鏈接發送至圖像特征提取單元;
A2、所述圖像特征提取單元根據所述URL資源鏈接獲取圖像數據,對所述圖像數據進行特征提取,并將所提取的聚合的圖像數據描述符編碼保存至圖像數據管理單元的數據庫中。
其中,對所述圖像數據進行特征提取具體包括如下處理:
A21、對所述圖像數據的圖像特征點進行提取,根據所述圖像特征點生成視覺單詞;
A22、利用所述視覺單詞獲得所述圖像數據的描述符,并對所述圖像數據的描述符進行聚合和壓縮;
A23、對壓縮后的所述圖像數據描述符進行編碼存儲。
其中,?所述編碼的位數為64個比特。
其中,所述步驟B具體包括如下步驟:
B1、利用用戶查詢單元獲取用戶輸入的源圖像文件;
B2、實時對用戶輸入的所述源圖像文件進行圖像特征提取分析,并生成源圖像文件的特征描述符;
B3、將所述源圖像文件的特征描述符與所述數據庫中的圖像數據描述符編碼進行匹配比較;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于康佳集團股份有限公司,未經康佳集團股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110348020.4/2.html,轉載請聲明來源鉆瓜專利網。
- 內容再現系統、內容提供方法、內容再現裝置、內容提供裝置、內容再現程序和內容提供程序
- 內容記錄系統、內容記錄方法、內容記錄設備和內容接收設備
- 內容服務系統、內容服務器、內容終端及內容服務方法
- 內容分發系統、內容分發裝置、內容再生終端及內容分發方法
- 內容發布、內容獲取的方法、內容發布裝置及內容傳播系統
- 內容提供裝置、內容提供方法、內容再現裝置、內容再現方法
- 內容傳輸設備、內容傳輸方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容發送設備、內容發送方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容再現裝置、內容再現方法、內容再現程序及內容提供系統
- 內容記錄裝置、內容編輯裝置、內容再生裝置、內容記錄方法、內容編輯方法、以及內容再生方法
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





