[發明專利]圖像處理方法、裝置、電子設備及存儲介質在審
| 申請號: | 201810439263.0 | 申請日: | 2018-05-09 |
| 公開(公告)號: | CN108647307A | 公開(公告)日: | 2018-10-12 |
| 發明(設計)人: | 馬福強;閆桂新;董澤華 | 申請(專利權)人: | 京東方科技集團股份有限公司;北京京東方光電科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06K9/62 |
| 代理公司: | 北京律智知識產權代理有限公司 11438 | 代理人: | 王輝;闞梓瑄 |
| 地址: | 100015 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 視覺詞典 視覺特征 視覺單詞 存儲介質 電子設備 距離最近 圖像處理 殘差 圖像處理技術 存儲規模 獲取圖像 聚類中心 提取圖像 訓練圖像 訓練集 移動端 聚類 輸出 返回 部署 | ||
本發明的實施例提供了一種圖像處理方法、裝置、電子設備及存儲介質,涉及圖像處理技術領域。該方法包括:S10.獲取圖像訓練集,并提取圖像訓練集中各訓練圖像的視覺特征;S20.對所述視覺特征進行聚類,生成以聚類中心作為視覺單詞組成的視覺詞典,并將視覺詞典的數量加1;S30.判斷視覺詞典的數量是否等于預定數量,若是,則輸出所生成的預定數量個視覺詞典,若否,則執行步驟S40;S40.確定視覺詞典中與視覺特征距離最近的視覺單詞;S50.計算視覺特征與距離最近的視覺單詞的殘差,將所述殘差作為新的所述視覺特征,并返回至步驟S20。本發明實施例的技術方案能夠顯著降低視覺詞典的存儲規模,便于在移動端進行部署。
技術領域
本發明涉及圖像處理技術領域,具體而言,涉及一種圖像處理方法、圖像處理裝置、電子設備以及計算機可讀存儲介質。
背景技術
圖像檢索技術在模式識別、SLAM(simultaneous localization and mapping,即時定位與地圖構建)以及人工智能等領域應用很廣泛。
圖像檢索技術的基本概念為:給定一張待檢索圖像,從特定圖像庫中檢索出與待檢索圖像相似的圖像或圖像集合。目前的圖像檢索技術例如基于詞袋模型的圖像檢索技術中,在圖像庫規模變大時,為了增加圖像向量的可區分性,通常需要非常大的視覺單詞規模,在圖像檢索階段,則需要預先加載由這些視覺單詞組成的視覺詞典,這將極大地增加內存的占用,難以滿足在移動端部署的需求。
因此,如何能夠有效降低視覺詞典中視覺單詞的規模成為亟待解決的技術問題。
需要說明的是,在上述背景技術部分公開的信息僅用于加強對本發明背景的理解,因此可以包括不構成對本領域普通技術人員已知的現有技術的信息。
發明內容
本發明實施例的目的在于提供一種圖像處理方法、圖像處理裝置、電子設備以及計算機可讀存儲介質,進而至少在一定程度上克服由于相關技術的限制和缺陷而導致的一個或者多個問題。
根據本發明實施例的第一方面,提供了一種圖像處理方法,包括:S10.獲取圖像訓練集,并提取所述圖像訓練集中各訓練圖像的視覺特征;S20.對所述視覺特征進行聚類,生成以聚類中心作為視覺單詞組成的視覺詞典,并將所述視覺詞典的數量加1;S30.判斷所述視覺詞典的數量是否等于預定數量,若是,則輸出所生成的所述預定數量個視覺詞典,若否,則執行步驟S40;S40.確定所述視覺詞典中與所述視覺特征距離最近的視覺單詞;S50.計算所述視覺特征與所述距離最近的視覺單詞的殘差,將所述殘差作為新的所述視覺特征,并返回至步驟S20。
在本發明的一些實施例中,基于前述方案,所述圖像處理方法還包括:提取待檢索圖像的視覺特征;從所述預定數量個視覺詞典中確定與所述待檢索圖像的視覺特征距離最近的多個視覺單詞,所述多個視覺單詞的數量與所述視覺詞典的數量相同;基于所述多個視覺單詞的索引確定所述待檢索圖像的視覺特征的索引。
在本發明的一些實施例中,基于前述方案,所述圖像處理方法還包括:基于所述預定數量個視覺詞典確定所述訓練圖像的各視覺特征的索引;確定所述訓練特征的各視覺特征的索引的詞頻-逆文檔頻率權重;基于各所述視覺特征的索引的所述詞頻-逆文檔頻率權重生成所述訓練圖像的詞袋向量。
在本發明的一些實施例中,基于前述方案,基于所述預定數量個視覺詞典確定所述訓練圖像的各視覺特征的索引,包括:從所述預定數量個視覺詞典中確定與所述視覺特征距離最近的多個視覺單詞,所述多個視覺單詞的數量與所述視覺詞典的數量相同;基于所述多個視覺單詞的索引確定所述視覺特征的索引。
在本發明的一些實施例中,基于前述方案,所述圖像處理方法還包括:提取待檢索圖像的視覺特征;基于所述預定數量個視覺詞典確定所述待檢索圖像的視覺特征的詞袋向量;確定所述待檢索圖像的所述詞袋向量與所述訓練圖像的詞袋向量的相似性;以及基于所確定的相似性的大小輸出與所述待檢索圖像相似的圖像。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于京東方科技集團股份有限公司;北京京東方光電科技有限公司,未經京東方科技集團股份有限公司;北京京東方光電科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810439263.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種二維碼掃碼交互方法和裝置
- 下一篇:分布式系統的序列號生成方法及裝置





