[發(fā)明專利]圖像特征提取方法、圖像搜索方法、服務器、終端及系統(tǒng)有效
| 申請?zhí)枺?/td> | 201210448102.0 | 申請日: | 2012-11-09 |
| 公開(公告)號: | CN103810488B | 公開(公告)日: | 2017-08-08 |
| 發(fā)明(設計)人: | 段曼妮;王從德;賈夢雷 | 申請(專利權(quán))人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06K9/46 | 分類號: | G06K9/46;G06F17/30;H04L29/08 |
| 代理公司: | 北京集佳知識產(chǎn)權(quán)代理有限公司11227 | 代理人: | 王寶筠 |
| 地址: | 英屬開曼群島大開曼*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 圖像 特征 提取 方法 搜索 服務器 終端 系統(tǒng) | ||
技術(shù)領(lǐng)域
本申請涉及圖像處理技術(shù)領(lǐng)域,特別涉及圖像特征提取方法、圖像搜索方法、服務器、終端及系統(tǒng)。
背景技術(shù)
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,網(wǎng)絡已經(jīng)與人們的生活密不可分,越來越多的人選擇網(wǎng)絡作為獲取信息的首要工具。
目前,為了實現(xiàn)通過網(wǎng)絡獲得人們想要的信息,通常采用將需要查找的信息對應的關(guān)鍵字作為檢索條件,發(fā)送給服務器,服務器根據(jù)檢索條件進行檢索,然后將檢索到的信息反饋給用戶。
但是,當用戶需要檢索一張圖像時,僅僅利用與該圖像對應的關(guān)鍵字無法將該圖像的特征準確的體現(xiàn),因此,通過關(guān)鍵字檢索得到的結(jié)果的準確性較低,用戶不得不更換關(guān)鍵詞后繼續(xù)向服務器發(fā)送請求,而服務器也需要不斷的響應用戶的請求,直到用戶找到滿意的圖像為止,由此可以看出,現(xiàn)有技術(shù)中利用關(guān)鍵字對圖像進行檢索的過程準確性低,服務器的資源消耗較大。
為了解決上述問題,現(xiàn)有技術(shù)中通常利用基于角點的圖像局部特征來進行圖像搜索。所謂角點,在現(xiàn)實世界中,其對應于物體的拐角,如道路的十字路口等。而在一幅圖像中,角點可以是文字的拐角處,筆畫的起始等。基于角點的圖像局部特征通過角點檢測算法獲得,該角點檢測算法通常分為兩類,第一類為基于模板的角點檢測方法,通常將預先設定的模板與圖像做卷積,得到的響應大的位置就是角點所在的位置,第二類為基于邊緣特征的角點檢測方法,通常為首先檢測出圖像中的邊緣,然后再求邊緣的交點,將該交點確定為角點。上述兩類算法進行角點定位后,需要確定角點的大小,然后得到一個角點區(qū)域,通常情況下,將該角點區(qū)域假設為一個圓形。這是因為圓形對于旋轉(zhuǎn)和尺度縮放都有較高的不變性,但是,其對于透視形變或仿射形變的不變性較低。當需要處理的圖像包含有文字信息時,如通過手機或相機對圖書封面進行拍照得到的圖像,除包含封面上的圖案外,還包括書名、作者、出版社等文字信息,由于此時需要對包含有文字信息的圖像進行透視形變或仿射形變,因此,利用現(xiàn)有的基于角點檢測算法獲得的基于角點的圖像特征的準確性較低,從而并未有效的解決對包含有文字信息的圖像進行檢索的過程準確性低,服務器的資源消耗較大的問題。
發(fā)明內(nèi)容
本申請的目的在于,提供圖像特征提取方法,以解決現(xiàn)有技術(shù)中服務器對包含有文字信息的圖像進行檢索的過程準確性低,資源消耗較大的問題,具體方案包括:
一種圖像特征提取方法,包括:
接收待搜索圖像;
對所述待搜索圖像進行區(qū)域定位,獲得至少一個備選區(qū)域;
確定符合預設分類條件的備選區(qū)域為目標區(qū)域;
對所述目標區(qū)域進行區(qū)域歸一化處理;
獲取與所述區(qū)域歸一化處理后的目標區(qū)域?qū)膱D像特征,并作為所述待搜索圖像對應的圖像特征。
優(yōu)選的,所述確定符合預設分類條件的備選區(qū)域為目標區(qū)域的過程包括:
從所述至少一個備選區(qū)域中選取當前待分析備選區(qū)域;
當所述當前待分析備選區(qū)域包含的角點個數(shù)小于預設角點個數(shù),且,所述當前待分析備選區(qū)域的面積與其對應的擬合橢圓的面積比值處于第一預設范圍內(nèi)時,確定所述當前待分析備選區(qū)域為目標區(qū)域;
或,
當所述當前待分析備選區(qū)域包含的角點個數(shù)大于或等于預設角點個數(shù),且,所述當前待分析備選區(qū)域?qū)臄M合橢圓面積與所述待搜索圖像的面積的比值大于或等于第一預設面積比值時,確定所述當前待分析備選區(qū)域為目標區(qū)域。
優(yōu)選的,通過以下過程對目標區(qū)域進行區(qū)域歸一化處理:
獲取所述目標區(qū)域?qū)臄M合橢圓的兩個短軸方向;
確定所述目標區(qū)域的重心;
根據(jù)所述兩個短軸方向及所述重心確定所述目標區(qū)域的主方向;
當所述目標區(qū)域不符合預設分裂條件時,將所述目標區(qū)域進行旋轉(zhuǎn)使其主方向為水平軸的正向;
將旋轉(zhuǎn)后的目標區(qū)域壓縮到預先設定的尺寸。
優(yōu)選的,所述根據(jù)所述兩個短軸方向及所述重心確定所述目標區(qū)域的主方向的過程包括:
獲取所述重心與所述擬合橢圓長軸的距離;
當所述距離小于預設距離值時,確定所述目標區(qū)域的主方向為所述兩個短軸方向;
當所述距離大于或等于預設距離值時,確定所述兩個短軸方向中與所述重心位置偏差較小的短軸方向為所述目標區(qū)域的主方向。
優(yōu)選的,當所述目標區(qū)域符合預設分裂條件時,還包括:
將所述目標區(qū)域依據(jù)所述擬合橢圓的長軸和短軸劃分為子區(qū)域;
確定所述目標區(qū)域的主方向分別為所述子區(qū)域的主方向;
將所述子區(qū)域分別進行旋轉(zhuǎn)使其主方向為水平軸的正向;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于阿里巴巴集團控股有限公司,未經(jīng)阿里巴巴集團控股有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210448102.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





