[發(fā)明專利]一種用于無(wú)人售貨柜的多角度視頻融合的商品識(shí)別算法有效
| 申請(qǐng)?zhí)枺?/td> | 201810686023.0 | 申請(qǐng)日: | 2018-06-28 |
| 公開(kāi)(公告)號(hào): | CN108960119B | 公開(kāi)(公告)日: | 2021-06-08 |
| 發(fā)明(設(shè)計(jì))人: | 蔡丁丁;方無(wú)迪;唐開(kāi);劉鈺濤;張運(yùn)輝 | 申請(qǐng)(專利權(quán))人: | 武漢市哈哈便利科技有限公司 |
| 主分類號(hào): | G06K9/00 | 分類號(hào): | G06K9/00;G06K9/62;G06N3/08 |
| 代理公司: | 南京縱橫知識(shí)產(chǎn)權(quán)代理有限公司 32224 | 代理人: | 徐瑛 |
| 地址: | 430000 湖北省武漢市東湖新技*** | 國(guó)省代碼: | 湖北;42 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 用于 無(wú)人 售貨 角度 視頻 融合 商品 識(shí)別 算法 | ||
1.一種用于無(wú)人售貨柜的多角度視頻融合的商品識(shí)別算法,其特征在于,包括以下步驟:
步驟一、對(duì)采集到的視頻數(shù)據(jù)進(jìn)行預(yù)處理,進(jìn)一步包括:采集視頻數(shù)據(jù)和對(duì)采集到的視頻數(shù)據(jù)進(jìn)行動(dòng)態(tài)區(qū)域檢測(cè),得到所述視頻數(shù)據(jù)中視頻幀的動(dòng)態(tài)區(qū)域;步驟一進(jìn)一步包括:采用時(shí)序動(dòng)態(tài)圖算法對(duì)視頻數(shù)據(jù)中連續(xù)的多幀圖像進(jìn)行計(jì)算,得到所述視頻數(shù)據(jù)的時(shí)序動(dòng)態(tài)圖,然后利用所述時(shí)序動(dòng)態(tài)圖得到所述視頻數(shù)據(jù)對(duì)應(yīng)的動(dòng)態(tài)區(qū)域掩碼,對(duì)所述動(dòng)態(tài)區(qū)域掩碼進(jìn)行平滑處理,將處理后的動(dòng)態(tài)區(qū)域掩碼應(yīng)用到所述視頻數(shù)據(jù)對(duì)應(yīng)的每一個(gè)視頻幀上,獲得所述視頻數(shù)據(jù)中的動(dòng)態(tài)區(qū)域,并將非動(dòng)態(tài)區(qū)域內(nèi)的像素全部設(shè)為零;
步驟二、對(duì)所述視頻數(shù)據(jù)中視頻幀進(jìn)行關(guān)鍵幀采樣;
步驟三、構(gòu)建深度卷積神經(jīng)網(wǎng)絡(luò)模型;
步驟四、利用采樣的關(guān)鍵幀對(duì)所述模型進(jìn)行訓(xùn)練和精度測(cè)試,在商品識(shí)別的精度達(dá)到預(yù)期后,部署所述模型,該步驟進(jìn)一步包括:特征提取、特征融合、特征識(shí)別;
基于Inception_v3模型的遷移學(xué)習(xí)技術(shù)分別對(duì)來(lái)自不同角度的視頻數(shù)據(jù)關(guān)鍵幀組進(jìn)行深度特征提取,采用的是平形的多流網(wǎng)絡(luò)結(jié)構(gòu),然后將提取到的多角度深度特征圖進(jìn)行特征融合;
對(duì)融合后的特征圖進(jìn)行特征識(shí)別和統(tǒng)計(jì)回歸:所述模型首先對(duì)視頻中所出現(xiàn)的商品進(jìn)行識(shí)別并正確分類,同時(shí)結(jié)合分類結(jié)果對(duì)識(shí)別的商品進(jìn)行統(tǒng)計(jì)計(jì)數(shù),計(jì)算對(duì)應(yīng)的商品數(shù)量;更具體來(lái)講,一旦所述模型識(shí)別出在視頻中出現(xiàn)的商品,其對(duì)應(yīng)的索引位置則會(huì)在輸出的類別向量中被激活,再結(jié)合被激活的索引位置,通過(guò)回歸計(jì)算得到其對(duì)應(yīng)商品的數(shù)目;
步驟五、來(lái)自無(wú)人售貨柜的不同角度攝像頭的視頻數(shù)據(jù)經(jīng)預(yù)處理和關(guān)鍵幀采樣后輸入所述模型,得到識(shí)別出的商品種類和對(duì)應(yīng)的商品數(shù)量。
2.如權(quán)利要求1所述的一種用于無(wú)人售貨柜的多角度視頻融合的商品識(shí)別算法,其特征在于,所述采集到的視頻數(shù)據(jù)來(lái)自以不同角度布置于無(wú)人售貨柜上的多個(gè)攝像頭。
3.如權(quán)利要求1所述的一種用于無(wú)人售貨柜的多角度視頻融合的商品識(shí)別算法,其特征在于,步驟二進(jìn)一步包括:以固定步長(zhǎng)或自適應(yīng)步長(zhǎng)進(jìn)行關(guān)鍵幀采樣。
4.如權(quán)利要求1所述的一種用于無(wú)人售貨柜的多角度視頻融合的商品識(shí)別算法,其特征在于,步驟三中,所述模型為基于TensorFlow的Keras框架下的Inception_v3模型。
5.如權(quán)利要求1所述的一種用于無(wú)人售貨柜的多角度視頻融合的商品識(shí)別算法,其特征在于,步驟四進(jìn)一步包括:對(duì)采樣的關(guān)鍵幀進(jìn)行深度特征提取,將提取到的多角度深度特征圖進(jìn)行特征融合,對(duì)融合后的特征圖進(jìn)行特征識(shí)別和統(tǒng)計(jì)回歸,得到兩個(gè)向量輸出,一個(gè)輸出向量為商品種類,另一個(gè)輸出向量為所述商品種類所對(duì)應(yīng)的商品數(shù)量。
6.如權(quán)利要求1所述的一種用于無(wú)人售貨柜的多角度視頻融合的商品識(shí)別算法,其特征在于,步驟四進(jìn)一步包括:所述模型在訓(xùn)練過(guò)程中,分別采用二分類交叉熵?fù)p失和最小平方差損失對(duì)商品種類和商品數(shù)量進(jìn)行優(yōu)化。
7.如權(quán)利要求1所述的一種用于無(wú)人售貨柜的多角度視頻融合的商品識(shí)別算法,其特征在于,所述模型具有多輸入多輸出結(jié)構(gòu),多輸入用于對(duì)來(lái)自多個(gè)角度的視頻數(shù)據(jù)同時(shí)進(jìn)行處理,多輸出用于分別計(jì)算商品種類和對(duì)應(yīng)的商品數(shù)量。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于武漢市哈哈便利科技有限公司,未經(jīng)武漢市哈哈便利科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810686023.0/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書(shū)寫(xiě)字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫(huà)組成的,而且每個(gè)筆畫(huà)表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 一種無(wú)人艇收放無(wú)人機(jī)裝置
- 一種基于無(wú)人機(jī)干擾的敵對(duì)無(wú)人船捕獲方法與系統(tǒng)
- 一種無(wú)人機(jī)協(xié)同無(wú)人艇充電的方法及系統(tǒng)
- 一種無(wú)人設(shè)備的控制方法及無(wú)人車
- 一種無(wú)人機(jī)自主識(shí)別靶標(biāo)并降落到運(yùn)動(dòng)的無(wú)人艇上的方法
- 無(wú)人機(jī)與無(wú)人船表演方法及裝置、存儲(chǔ)介質(zhì)和電子設(shè)備
- 連發(fā)無(wú)人機(jī)電磁彈射系統(tǒng)及無(wú)人機(jī)機(jī)庫(kù)
- 適用于惡劣海況的異構(gòu)無(wú)人系統(tǒng)協(xié)同編隊(duì)控制系統(tǒng)及方法
- 連發(fā)無(wú)人機(jī)電磁彈射系統(tǒng)及無(wú)人機(jī)機(jī)庫(kù)
- 無(wú)人機(jī)的控制方法、裝置、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)及無(wú)人機(jī)
- 與遠(yuǎn)程數(shù)據(jù)處理設(shè)備通信的虛擬自動(dòng)售貨機(jī)
- 能夠自動(dòng)補(bǔ)貨的售貨機(jī)
- 具有補(bǔ)貨機(jī)構(gòu)的自動(dòng)售貨機(jī)
- 一種自動(dòng)售貨機(jī)
- 能夠自動(dòng)補(bǔ)貨的售貨機(jī)
- 具有補(bǔ)貨機(jī)構(gòu)的自動(dòng)售貨機(jī)
- 自動(dòng)售貨機(jī)子機(jī)及自動(dòng)售貨機(jī)系統(tǒng)
- 一種雙向出貨自動(dòng)售貨機(jī)
- 一種自動(dòng)售貨機(jī)
- 一種售貨機(jī)激活系統(tǒng)及售貨機(jī)離線售貨方法





