[發(fā)明專利]結(jié)合全局與局部特征的目標(biāo)檢測裝置、方法和存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 202111096419.8 | 申請日: | 2021-09-18 |
| 公開(公告)號: | CN113554125B | 公開(公告)日: | 2021-12-17 |
| 發(fā)明(設(shè)計(jì))人: | 桑高麗;閆超;趙梓杰 | 申請(專利權(quán))人: | 四川翼飛視科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 成都君合集專利代理事務(wù)所(普通合伙) 51228 | 代理人: | 尹玉 |
| 地址: | 610094 四川省成都市高新*** | 國省代碼: | 四川;51 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 結(jié)合 全局 局部 特征 目標(biāo) 檢測 裝置 方法 存儲 介質(zhì) | ||
本發(fā)明公開了一種結(jié)合全局與局部特征的目標(biāo)檢測裝置、方法和存儲介質(zhì),網(wǎng)絡(luò)模型包括深層特征信息提取部分以及目標(biāo)檢測器部分,所述深層特征信息提取部分采用分?合結(jié)構(gòu)搭建,且包括卷積網(wǎng)絡(luò)、變形多頭自注意力網(wǎng)絡(luò)、橋接融合模塊,所述卷積網(wǎng)絡(luò)、變形多頭自注意力網(wǎng)絡(luò)并列設(shè)置,且輸出端分別與橋接融合模塊的輸入端連接。本發(fā)明通過橋接融合模塊計(jì)算多種模態(tài)特征信息之間的聯(lián)系,即計(jì)算全局表示和局部特征之間的相關(guān)性,從而獲取特征層次上的上下文信息,充分融合全局和局部特征。本發(fā)明在全局上提高模型對圖像中背景和目標(biāo)的區(qū)分能力,減少噪聲的干擾,同時,在局部上提升模型的表達(dá)能力,能更好的定位目標(biāo)的位置,提高模型的精準(zhǔn)度和泛化性。
技術(shù)領(lǐng)域
本發(fā)明屬于目標(biāo)檢測的技術(shù)領(lǐng)域,具體涉及一種結(jié)合全局與局部特征的目標(biāo)檢測裝置、方法和存儲介質(zhì)。
背景技術(shù)
隨著國家經(jīng)濟(jì)的繁榮發(fā)展,城市化建設(shè)范圍也不斷擴(kuò)大,如樓房修建、道路建設(shè)等等基礎(chǔ)設(shè)施搭建,很大程度上便利了人們的學(xué)習(xí)生活。其中,在復(fù)雜環(huán)境下,安全帽是施工人員身上最重要的防護(hù)用品,明令要求所有人員進(jìn)入施工場所時必須佩戴安全帽,因此,為了保證工作人員的人身安全,引入智能監(jiān)管技術(shù)迫在眉睫。
近幾年,已有的智能監(jiān)控技術(shù)都是在計(jì)算機(jī)視覺技術(shù)的基礎(chǔ)上發(fā)展得到的,而安全帽目標(biāo)檢測方法是這些技術(shù)中的一門研究方向。安全帽目標(biāo)檢測方法主要分為兩類:基于傳統(tǒng)圖像處理的技術(shù)方法和基于深度學(xué)習(xí)的技術(shù)方法。隨著檢測方法應(yīng)用的場景不斷增加,基于傳統(tǒng)圖像處理的技術(shù)方法因單一的特征信息而導(dǎo)致泛化能力差,不能良好的適應(yīng)復(fù)雜的現(xiàn)實(shí)場景;而基于深度學(xué)習(xí)的技術(shù)方法充分利用多種語義豐富的特征信息,學(xué)習(xí)得到能適應(yīng)實(shí)際場景變化的預(yù)判能力,不負(fù)眾望地取得了良好的檢測精度。
目前,大多數(shù)的安全帽目標(biāo)檢測方法能在較為良好的場景下對人員佩戴安全帽進(jìn)行檢測,但是實(shí)際的監(jiān)控場景中佩戴安全帽的人員像素占比較小,而且隨著施工場所光線和拍攝角度的變化,安全帽表面的顏色和形狀會因此引入較多的噪聲干擾,導(dǎo)致已有的算法適用性變差,檢測精準(zhǔn)度大大退化。因此,急需提出一種對安全帽顏色和形狀變化泛化性強(qiáng)和檢測精度高的目標(biāo)檢測方案,能在視頻監(jiān)控中達(dá)到監(jiān)管安全的作用,更加有效的保證工作人員的人身安全。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種結(jié)合全局與局部特征的目標(biāo)檢測裝置、方法和存儲介質(zhì),是基于全局表示和局部特征學(xué)習(xí)的目標(biāo)檢測技術(shù),旨在解決上述問題。
本發(fā)明主要通過以下技術(shù)方案實(shí)現(xiàn):
結(jié)合全局與局部特征的目標(biāo)檢測裝置,包括數(shù)據(jù)處理模塊、訓(xùn)練模塊、檢測模塊,所述數(shù)據(jù)處理模塊用于收集、標(biāo)注圖像樣本,并得到訓(xùn)練集;所述訓(xùn)練模塊用于利用訓(xùn)練集訓(xùn)練目標(biāo)檢測的網(wǎng)絡(luò)模型并得到訓(xùn)練后的檢測模型;所述檢測模塊用于將待測圖片輸入到訓(xùn)練后的檢測模型并輸出目標(biāo)檢測的結(jié)果;
所述網(wǎng)絡(luò)模型包括從前至后依次連接的若干個深層特征信息提取部分以及目標(biāo)檢測器部分,所述深層特征信息提取部分采用分-合結(jié)構(gòu)搭建,且用于提取圖像樣本的深層特征信息,所述目標(biāo)檢測器部分用于根據(jù)深層特征信息進(jìn)行目標(biāo)定位及分類;所述深層特征信息提取部分包括卷積網(wǎng)絡(luò)、變形多頭自注意力網(wǎng)絡(luò)、橋接融合模塊,所述卷積網(wǎng)絡(luò)、變形多頭自注意力網(wǎng)絡(luò)并列設(shè)置,且輸出端分別與橋接融合模塊的輸入端連接。
其中所述的分合結(jié)構(gòu)中分結(jié)構(gòu)是指并行使用卷積網(wǎng)絡(luò)和變形多頭自注意力提取圖像樣本的特征網(wǎng)絡(luò)部分,而合結(jié)構(gòu)是指利用橋接融合模塊將分結(jié)構(gòu)中提取的特征進(jìn)行融合的網(wǎng)絡(luò)部分。所述的橋接融合模塊能更好的融合不同特性的特征信息,提高模型對目標(biāo)的表達(dá)能力。本發(fā)明根據(jù)圖像目標(biāo)的特點(diǎn)構(gòu)建出網(wǎng)絡(luò)結(jié)構(gòu),從圖像全局表示和目標(biāo)局部特征分析理解,能更好的定位目標(biāo)的位置,提高模型的精準(zhǔn)度和泛化性。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于四川翼飛視科技有限公司,未經(jīng)四川翼飛視科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111096419.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 用于靈活柵格光網(wǎng)絡(luò)全局優(yōu)化的系統(tǒng)架構(gòu)及其全局優(yōu)化方法
- 一種基于多數(shù)據(jù)庫類型的SQL執(zhí)行方法和裝置
- 用于移動AdHoc網(wǎng)絡(luò)的路由入侵檢測系統(tǒng)
- 一種分布式事務(wù)管理方法及系統(tǒng)
- 全局資源分配方法和裝置
- 一種通信方法及裝置
- 一種高效分布式全局鎖協(xié)調(diào)方法
- 一種帶上下文信息編碼的語義分割卷積神經(jīng)網(wǎng)絡(luò)
- 一種批量腳本的全局參數(shù)替換方法及裝置
- 一種基于全局變量的家居參數(shù)化模型建模系統(tǒng)及方法





