[發明專利]視覺識別方法、裝置、設備及存儲介質在審
| 申請號: | 201910056515.6 | 申請日: | 2019-01-22 |
| 公開(公告)號: | CN111461104A | 公開(公告)日: | 2020-07-28 |
| 發明(設計)人: | 李耀波;劉旭 | 申請(專利權)人: | 北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司 |
| 主分類號: | G06K9/32 | 分類號: | G06K9/32;G06K9/62;G06N3/02 |
| 代理公司: | 北京同立鈞成知識產權代理有限公司 11205 | 代理人: | 吳會英;劉芳 |
| 地址: | 100195 北京市海淀區杏石口路6*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 視覺 識別 方法 裝置 設備 存儲 介質 | ||
本發明提供了一種視覺識別方法、裝置、設備及存儲介質,該方法包括:若監測到用戶拿取目標,則采集視頻幀圖片;確定每幀圖片中的目標的感興趣區域;提取每幀圖片中的目標的感興趣區域形成每幀目標圖片;對每幀目標圖片進行縮放處理,獲得每幀目標縮放圖片;采用第一目標檢測算法對每幀目標縮放圖片進行視覺識別,以獲得識別結果。由于對每幀圖片進行無效區域的排除,提取出目標的感興趣區域進行縮放處理后作為第一目標檢測算法的輸入圖片,放大了目標的感興趣區域的比例,所以提高了目標的檢出率和準確率。
技術領域
本發明實施例涉及計算機視覺技術領域,尤其涉及一種視覺識別方法、裝置、設備及存儲介質。
背景技術
隨著移動互聯網及人工智能的發展,涌現了無人售貨柜,無人售貨超市等來滿足人們的購物需求,提高人們的購物體驗。在無人售貨柜或無人售貨超市購物時,需要在人們從貨架上選購商品的過程中對商品進行自動視覺識別。
目標的視覺識別方法是通過架設在貨架頂部的傳感器采集包含目標的圖像或視頻序列并利用計算機視覺技術對圖像或視頻序列中的目標進行檢測,實現對目標的分類,達到識別的結果。
現有技術中,對目標的視覺識別方法主要有基于圖像匹配的視覺識別方法,基于特征向量比對的視覺識別方法或基于深度學習的視覺識別方法。基于圖像匹配的視覺識別方法中,利用圖像的特征點進行匹配,根據采集的目標圖片與注冊庫中的匹配度進行識別分類。基于特征向量比對的視覺識別方法提取采集的圖片內目標的特征向量,并與注冊庫中的物品的特征向量進行距離度量判斷相似度從而進行視覺識別。基于深度學習的視覺識別方法運用目標檢測算法對圖片中的目標進行目標定位,從而達到視覺識別的結果。目標檢測算法可以為SSD算法。
現有技術中的基于圖像匹配的視覺識別方法和基于特征向量比對的視覺識別方法受光線變化和目標姿態變化的影響較大,并且算法復雜,耗時長。而現有技術中的基于SSD算法視覺識別方法雖然受光線變化和目標姿態變化的影響小,耗時短,但由于目標在無人售貨柜或無人售貨超市的貨架上分多層擺放,架在頂部的攝像頭拍攝的畫面中的遠景目標過小,導致基于SSD算法視覺識別方法的目標檢出率和準確率都大大降低。
發明內容
本發明實施例提供一種視覺識別方法、裝置、設備及存儲介質,解決了現有技術中視覺識別方法受光線變化和目標姿態變化的影響小,耗時短,架在頂部的攝像頭拍攝的畫面中的遠景目標過小,導致基于SSD算法視覺識別方法的目標檢出率和準確率都大大降低的技術問題。
第一方面,本發明實施例提供一種視覺識別方法,包括:若監測到拾取方拿取目標,則采集視頻幀圖片;確定每幀圖片中的目標的感興趣區域;提取所述每幀圖片中的目標的感興趣區域形成每幀目標圖片;對所述每幀目標圖片進行縮放處理,獲得每幀目標縮放圖片;采用第一目標檢測算法對每幀目標縮放圖片進行視覺識別,以獲得識別結果。
第二方面,本發明實施例提供一種視覺識別裝置,包括:視頻幀圖片采集單元,用于若監測到拾取方拿取目標,則采集視頻幀圖片;目標感興趣區域確定單元,用于確定每幀圖片中的目標的感興趣區域;目標感興趣區域提取單元,用于提取所述每幀圖片中的目標的感興趣區域形成每幀目標圖片;目標圖片縮放單元,用于對所述每幀目標圖片進行縮放處理,獲得每幀目標縮放圖片;目標識別單元,用于采用第一目標檢測算法對每幀目標縮放圖片進行視覺識別,以獲得識別結果。
第三方面,本發明實施例提供一種電子設備,包括:一個或多個處理器;存儲裝置,用于存儲一個或多個程序;視頻幀采集裝置,用于采集視頻幀圖片;當所述一個或多個程序被所述一個或多個處理器執行,使得所述一個或多個處理器實現如第一方面中任一項所述的方法。
第四方面,本發明實施例提供一種可讀存儲介質,其特征在于,其上存儲有計算機程序,所述計算機程序被處理器執行以實現如第一方面中任一項所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司,未經北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910056515.6/2.html,轉載請聲明來源鉆瓜專利網。





