[發明專利]基于詞匯樹檢索與相似度驗證的云端圖像識別方法在審
| 申請號: | 201710073040.2 | 申請日: | 2017-02-10 |
| 公開(公告)號: | CN106874445A | 公開(公告)日: | 2017-06-20 |
| 發明(設計)人: | 施茂燊 | 申請(專利權)人: | 深圳前海大造科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 成都行之專利代理事務所(普通合伙)51220 | 代理人: | 田甜 |
| 地址: | 518000 廣東省深圳市前海深港合作區前*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 詞匯 檢索 相似 驗證 云端 圖像 識別 方法 | ||
技術領域
本發明涉及圖像識別技術領域,具體涉及一種基于詞匯樹檢索與相似度驗證的云端圖像識別方法。
背景技術
實時圖像搜索是一種可以支持用戶自定義的,超大規模的圖像數據庫的實時圖像識別技術。它可以實現對移動端設備的圖像輸入內容進行實時的識別。整個識別過程是在云端進行的,這樣可以使用戶無需將龐大的圖像數據庫下載到本地,并且也可以充分地利用云端計算資源對數據庫進行高速的檢索。
然而,目前基于云端的實時圖像識別技術其通過上傳本地圖片到服務器,服務器將帶識別的圖片與存儲的圖片逐一進行比較,其存在以下缺陷:在無線網絡較差的情況下,用戶實時上傳圖像的速度會受到很大影響。
發明內容
本發明為了解決上述技術問題提供一種基于詞匯樹檢索與相似度驗證的云端圖像識別方法。
本發明通過下述技術方案實現:
基于詞匯樹檢索與相似度驗證的云端圖像識別方法,包括以下步驟,
圖像獲取步驟:獲取目標圖像,并對目標圖像使用ORB算法提取所有ORB特征點,并對每一個ORB特征點生成相應的描述子,生成目標圖像的ORB描述子序列;
圖像上傳步驟:將該ORB描述子序列上傳到基于描述子樣本的云端圖像數據庫中;
圖像識別步驟:云端圖像數據庫利用基于詞匯樹的檢索算法對圖像進行匹配識別并返回匹配度靠前的N張候選圖像,其中N為大于1的自然數;
相似度驗證步驟:在云端圖像數據庫中找到候選圖像,得到目標圖像和候選圖像的128維向量,分別計算目標圖像與各候選圖像之間的距離,并找出距離最短的候選圖像。
本發明通過提取目標圖像的ORB特征點以生成ORB描述子序列,并將ORB描述子序列上傳至基于描述子樣本的云端圖像數據庫中進行檢索匹配,相比于上傳目標圖像的方式,描述子的數據量小,減小對網絡的要求,即網絡較差對識別的速度影響小。利用詞匯樹檢索算法找出匹配度靠前的N張圖像后利用目標圖像和候選圖像之間的距離進行相似性驗證,該相似性驗證為小規模的,即可保證快速檢索,也極大的提高了檢索的精度。
所述云端圖像數據庫的生成方法包括以下步驟:
描述子生成步驟:收集圖片,提取每張圖片的ORB特征點,并對每個ORB特征點生成相應的描述子以得到描述子樣本;
樹狀模型生成步驟:根據描述子樣本生成圖像數據庫的樹狀模型;
數據庫生成步驟:向樹狀模型中添加圖片,建立樹狀結構的圖像數據庫。
現有的圖像匹配是圖像和圖像之間的匹配,檢索的時間的增加隨著圖像的增加線性增長。一個特征描述子到數據庫里匹配所有特征描述子,數據庫里的描述子越多,匹配的時間就越長,因為暴力匹配是一一匹配,最后尋找距離最短的匹配組。在保證一定準確度的前提下,其檢索速度和廣度存在矛盾,這兩點都與云端圖像數據庫的大小密切相關。而采用上述方法,由于數據庫中的描述子已經進行樹狀分類,在進行匹配的時候,待匹配的描述子會尋找與其最相似的分支,而不需要遍歷真個數據庫,即樹狀檢索結構可以讓待匹配的特征描述子不用一一匹配所有的描述子,檢索時間主要跟經過的節點數有關系,數據庫中的描述子多不代表檢索經過的節點數越多。所以檢索時間不是按數據庫的大小線性增加,而是對數增長,解決檢索廣度與速度之間的矛盾。而對于新加入圖像描述子會加入相應的分支,而不是單純的增加,因此在廣度上也能很好的解決大數據庫的檢索情況。
所述描述子生成步驟具體為:收集圖片,分別對每張圖片進行縮放以建立一個圖像金字塔,對圖片的各個尺度使用ORB算法提取所有ORB特征點,并對每一個ORB特征點生成相應的描述子。
所述樹狀模型生成步驟為:利用描述子之間的歐式距離作為判據,對描述子樣本用K-means算法做聚合分類,生成圖像數據庫的樹狀模型。
所述樹狀模型生成步驟具體為:
A1、定義一個樹狀結構,其最大層數為L,每層最大子節點數為K;
A2、對描述子樣本用K-means算法做聚合分類,得到子節點分類結果,將每個子節點內所有描述子的平均描述子作為該子節點的描述子;
A3、若該子節點內描述子樣本的數量大于K的兩倍,則對該子節點內的描述子樣本作進一步的K-means分類,重復該步驟,直至樹狀結構的最大層數小于等于L或者沒有子節點的描述子樣本數量大于K的兩倍;
A4、對所有的子節點依次排序標號,生成圖像數據庫的樹狀模型。
所述數據庫生成步驟為:
B1、給圖片一個唯一的編號;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳前海大造科技有限公司,未經深圳前海大造科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710073040.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:圖片處理方法及裝置
- 下一篇:一種基于磁盤的詞匯樹模型構建方法





