[發明專利]圖像檢索數據庫建立方法在審
| 申請號: | 201310424717.4 | 申請日: | 2013-09-17 |
| 公開(公告)號: | CN104462111A | 公開(公告)日: | 2015-03-25 |
| 發明(設計)人: | 陳卓;李薪宇 | 申請(專利權)人: | 成都理想境界科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06K9/62 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 610041 四川省成都市高新區*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖像 檢索 數據庫 建立 方法 | ||
技術領域
本發明涉及圖像識別領域,尤其涉及一種圖像檢索數據庫建立方法。
背景技術
眾所周知,在基于內容識別的圖像檢索技術中,首先需要在服務器端訓練樣本圖像,對樣本圖像進行特征提取,以形成圖像檢索特征數據庫。
在生成圖像檢索特征數據的過程中,以現有技術進行處理時,由于大量目標圖像中存在較多的印刷體文字,在文字區域中像素點顏色分布的相似性導致大量具有近似的關鍵點描述內容的關鍵點被提取出來,在檢索過程中會對檢索結果產生極大的干擾,以致產生錯誤的檢索結果。
另外,圖像識別常常受到不精確的特征匹配過程的妨礙,不精確的特征匹配過程會因仿射變換(因視角或觀看點的改變而使獲取圖像顯示形變)和其它失真(例如,當圖像獲取端得到的圖像比較模糊時,其特征將發生顯著變化)而加劇,從而導致正確匹配的減少和錯誤匹配的增加。
發明內容
本發明的目的是提供一種圖像檢索數據庫建立方法,將易造成干擾的文字區域特征剔除出檢索數據庫,僅保存非文字區域圖像特征,能有效消除文字相似特征對圖像檢索結果的干擾。
為了實現上述發明目的,本發明提供了一種圖像檢索數據庫建立方法,包括:對待訓練的原目標圖像進行預處理,形成訓練圖像集;對所述訓練圖像集中的每一副圖像進行特征點提取;對所述訓練圖像集中的每一副圖像進行分割,得到文字區域和非文字區域;將像素位置與文字區域重合的特征點剔除,用剩下的特征點生成圖像檢索數據庫中對應于原目標圖像的特征數據。
相應的,本發明還提供了一種圖像檢索數據庫建立方法,包括:對待訓練的目標圖像進行預處理,形成訓練圖像集;對所述訓練圖像集中的每一副圖像進行分割,得到文本字區域和非文字區域;對所述訓練圖像集中每一副圖像的非文字區域進行特征點提取,圖像檢索數據庫中對應于目標圖像的特征數據。
上述兩種方法的區別在于:第一種方法為先對所述訓練圖像集中的每一副圖像進行特征點提取,然后再將文字區域的特征點剔除;而第二種方法為直接僅對所述訓練圖像集中每一副圖像的非文字區域進行特征點提取,對文字區域不進行特征提取。
上述兩種方法中,對所述訓練圖像集中的每一副圖像進行分割,得到文字區域和非文字區域,進一步包括:將圖像在垂直和水平兩個方向上沿著圖像中的空白區域遞歸地進行切割,得到一個個無法再切割矩形框區域;將單個矩形框區域的大小小于等于訓練圖像整圖的6%時,判定該矩形框區域為文字區域,剩下的為非文字區域。其中,所述圖像中的空白區域包括:頁邊空白、分欄邊緣、縮進空白、圖像與文本區域交界部分空白、文字與文字之間的空白。
上述兩種方法中,所述對待訓練的原目標圖像進行預處理,形成訓練圖像集,優選方案為:將待訓練的原目標圖像通過高斯模糊的方式處理,模擬焦外成像效果,得到與檢索圖像近似的模糊目標圖像;在N個方向上分別對原目標圖像和模糊目標圖像進行仿射變換,得到2N張新的訓練圖像,其中2≤N≤8;2N張新的訓練圖與原目標圖像、模糊目標圖像一起組成訓練圖像集。
上述兩種方法中,還可以對原目標圖像中的文字區域進行文字識別,將識別出的文字信息作為圖像檢索數據庫中對應于原目標圖像的第二檢索數據。
與現有技術相比,本發明具有如下有益效果:
1.本發明將易造成干擾的文字區域特征剔除出檢索數據庫,只保存非文字區域圖像特征,能有效消除文字相似特征對圖像檢索結果的干擾;另外對文字區域可以用OCR的方法進行文字識別以提取出文字區域中的文字信息,這一信息也可作為圖像檢索的次要特征用于某些特定種類的圖像檢索(如名片檢索);
2.本發明通過在訓練圖像集中加入原訓練圖像(待訓練的原目標圖像)的模糊圖像之后,在使用手持設備或穿戴設備的攝像頭獲取圖像來進行檢索時,如果獲取到的圖像是焦外模糊的圖像(即未對焦的情況下得到的圖像),這時仍然能夠在檢索數據庫中找到正確的目標圖像。同時,在訓練圖像集中加入仿射變換的處理,可以使用戶在視角大于80度的情況下仍然能夠準確地找到檢索數據庫中的目標圖像。
附圖說明
為了更清楚地說明本發明實施例或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些實施例,對于本領域普通技術人員來講,在不付出創造性勞動性的前提下,還可以根據這些附圖獲得其他的附圖:
圖1為本發明實施例一圖像檢索數據庫建立方法流程示意圖;
圖2為本發明實施例二圖像檢索數據庫建立方法流程示意圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于成都理想境界科技有限公司,未經成都理想境界科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310424717.4/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





