[發(fā)明專利]基于深度學習的目標差異性檢測方法和目標差異性檢測設(shè)備有效
| 申請?zhí)枺?/td> | 201710111731.7 | 申請日: | 2017-02-28 |
| 公開(公告)號: | CN108509963B | 公開(公告)日: | 2023-04-28 |
| 發(fā)明(設(shè)計)人: | 韓穎婕 | 申請(專利權(quán))人: | 株式會社日立制作所 |
| 主分類號: | G06V20/52 | 分類號: | G06V20/52;G06V20/40;G06V40/10;G06V10/74;G06V10/82;G06N3/084;G06N3/0464 |
| 代理公司: | 上海華誠知識產(chǎn)權(quán)代理有限公司 31300 | 代理人: | 肖華 |
| 地址: | 日本國東京都千*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 深度 學習 目標 差異性 檢測 方法 設(shè)備 | ||
本發(fā)明提供了一種基于深度學習的目標差異性檢測方法和目標差異性檢測設(shè)備。該方法包括:通過訓練好的網(wǎng)絡(luò)模型,對第一目標圖像進行第一前向傳播以計算第一特征向量并記錄網(wǎng)絡(luò)模型的第一狀態(tài)值,對第二目標圖像進行第二前向傳播以計算第二特征向量并記錄網(wǎng)絡(luò)模型的第二狀態(tài)值;根據(jù)第一和第二特征向量,判斷第一目標圖像與第二目標圖像是否相似;當判斷兩者相似時,根據(jù)第一和第二特征向量,計算差異向量;以及將差異向量作為梯度,通過具有第一狀態(tài)值的網(wǎng)絡(luò)模型進行第一反向傳播以獲得第一差異熱力圖,通過具有第二狀態(tài)值的網(wǎng)絡(luò)模型進行第二反向傳播以獲得第二差異熱力圖。通過采用本發(fā)明,能夠有效地檢測出相似目標之間的差異性。
技術(shù)領(lǐng)域
本發(fā)明涉及深度學習以及視頻監(jiān)控領(lǐng)域,尤其涉及一種基于深度學習的目標差異性檢測方法和目標差異性檢測設(shè)備。
背景技術(shù)
在視頻監(jiān)控領(lǐng)域,很多時候需要在不同攝像頭中找到同一個人,比如罪犯的行蹤,在商場找到走丟的兒童或老人等。人臉識別是較為準確的一種視頻識別技術(shù),但它依賴于視頻拍攝角度,只有正面人臉才能達到較高的識別率。然而,很多時候,無法在監(jiān)控視頻中看到人臉,可能只能看到人的背影或人的側(cè)面,或人臉被帽子口罩遮檔。不依賴于人臉識別技術(shù),通過對人的整體特征來進行識別的技術(shù)被稱為行人重識別技術(shù)(person?reID)。但是因為行人重識別是對人的整體特征進行識別,不同攝像頭采集到的行人的角度不同,識別難度大,因此識別準確率沒有人臉識別高,該技術(shù)可以找到很多相似的人,可以用于跨攝像頭視頻檢索的初選篩查。
深度學習利用大量樣本來訓練深度神經(jīng)網(wǎng)絡(luò),進而進行特征提取,被廣泛應用于計算機視覺領(lǐng)域,用于進行目標檢測,人臉識別等。下面給出的專利文獻1和非專利文獻2公開了利用深度學習來進行行人重識別的技術(shù)。
專利文獻1(公開號CN105354548A,公開日2016年2月24日)公開了一種基于ImageNet檢索的監(jiān)控視頻行人重識別方法。該方法利用imageNet深度學習網(wǎng)絡(luò)來更好地適應光照、視角、姿態(tài)和尺度的變化,有效提升了跨攝像頭環(huán)境下行人重識別結(jié)果的精度和魯棒性。
非專利文獻2(W.Li、R.Zhao、T.Xiao和X.Wang,IEEE?International?Conferenceon?Computer?Vision?and?Pattern?Recognition(CVPR),2014,“DeepReID?Deep?FilterPairing?Neural?Network?for?Person?Re-Identification”)公開了通過設(shè)計DeepReID網(wǎng)絡(luò)來提升跨攝像頭環(huán)境下行人重識別結(jié)果的精度的技術(shù)方案。上述非專利文獻2可以從以下網(wǎng)站獲得:http://ieeexplore.ieee.org/document/6909421/?arnumber=6909421。
上述專利文獻1和非專利文獻2都是研究如何提升跨攝像頭環(huán)境下行人重識別結(jié)果的精度。
但是受限于跨攝像頭環(huán)境,不同攝像頭拍攝角度不同,清晰度不同,光線的不同,即使人眼觀察,很多穿著相似的人也很難被區(qū)分開。從技術(shù)上,很難單純利用行人重識別技術(shù)來實現(xiàn)高準確率的行人目標識別。
此外,有時同一個人在不同攝像頭下拍攝到的狀態(tài)可能不同。比如,脫掉了外套,或者購物后手里多了手提袋。如果單純利用行人重識別技術(shù)來實現(xiàn)高準確率,很有可能會因為目標狀態(tài)改變而發(fā)生漏檢。
因此,本發(fā)明的目的并不是去提高行人重識別技術(shù)的準確率。本發(fā)明的目的是先通過行人重識別來找到相似行人,然后檢測相似行人之間的差異性并顯示出來。
發(fā)明內(nèi)容
鑒于上述問題,本發(fā)明提出了一種基于深度學習的目標差異性檢測方法和目標差異性檢測設(shè)備。本發(fā)明的目標差異性檢測方法和目標差異性檢測設(shè)備,能夠有效地檢測出相似目標之間的差異性。
根據(jù)本發(fā)明的一個方面,提供了一種基于深度學習的目標差異性檢測方法,所述檢測方法包括以下步驟:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于株式會社日立制作所,未經(jīng)株式會社日立制作所許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710111731.7/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





