[發(fā)明專利]一種基于弱監(jiān)督判別機(jī)制的圖像目標(biāo)檢測(cè)方法、系統(tǒng)及裝置有效
| 申請(qǐng)?zhí)枺?/td> | 202110405637.9 | 申請(qǐng)日: | 2021-04-15 |
| 公開(公告)號(hào): | CN113095235B | 公開(公告)日: | 2023-10-27 |
| 發(fā)明(設(shè)計(jì))人: | 喬學(xué)明;尹明立;朱偉義;鄭鵬飛;孫海峰;孟平;湯耀;王超;宮寶凝;劉振華;翟明遠(yuǎn);呂琳;代勤瑞;李曉芳;朱東杰 | 申請(qǐng)(專利權(quán))人: | 國家電網(wǎng)有限公司;國網(wǎng)山東省電力公司威海供電公司 |
| 主分類號(hào): | G06V20/60 | 分類號(hào): | G06V20/60;G06V10/46;G06V10/762;G06V10/82;G06N3/0464;G06N3/044;G06N3/08 |
| 代理公司: | 哈爾濱市松花江專利商標(biāo)事務(wù)所 23109 | 代理人: | 時(shí)起磊 |
| 地址: | 100031 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 監(jiān)督 判別 機(jī)制 圖像 目標(biāo) 檢測(cè) 方法 系統(tǒng) 裝置 | ||
一種基于弱監(jiān)督判別機(jī)制的圖像目標(biāo)檢測(cè)方法、系統(tǒng)及裝置,涉及圖像目標(biāo)檢測(cè)方法、系統(tǒng)及裝置。為了解決現(xiàn)有的圖像目標(biāo)檢測(cè)方法中同一類圖片的數(shù)據(jù)少會(huì)導(dǎo)致分類不足問題,本發(fā)明所述方法利用目標(biāo)檢測(cè)網(wǎng)絡(luò)模型對(duì)待檢測(cè)的圖像進(jìn)行檢測(cè);首先將圖像輸入到特征提取網(wǎng)絡(luò)提取特征;然后,將提取的特征送到CCN網(wǎng)絡(luò)進(jìn)行處理;所述CCN網(wǎng)絡(luò)包括三個(gè)平行的卷積網(wǎng)絡(luò),三個(gè)平行的卷積網(wǎng)絡(luò)分別記為網(wǎng)絡(luò)A、網(wǎng)絡(luò)B和網(wǎng)絡(luò)C,每個(gè)卷積網(wǎng)絡(luò)均包括4個(gè)卷積層、一個(gè)單級(jí)SPP層和一個(gè)FC層,F(xiàn)C層即全連接層;將網(wǎng)絡(luò)A中FC層的輸出傳入到網(wǎng)絡(luò)B的spp層,同時(shí)將網(wǎng)絡(luò)B中FC層的輸出傳入到網(wǎng)絡(luò)A的spp層;網(wǎng)絡(luò)C的FC層之后設(shè)有一個(gè)1×1卷積層。主要用于圖像目標(biāo)的檢測(cè)。
技術(shù)領(lǐng)域
本發(fā)明涉及圖像目標(biāo)檢測(cè)方法、系統(tǒng)及裝置。
背景技術(shù)
在當(dāng)今信息發(fā)達(dá)的網(wǎng)絡(luò)時(shí)代,本發(fā)明每天會(huì)看到各種各樣的圖片,圖像分類、目標(biāo)檢測(cè)、分割目前是計(jì)算機(jī)視覺領(lǐng)域的三大任務(wù)。高效快速地對(duì)所需要的信息圖片目標(biāo)進(jìn)行檢測(cè)將有利于本發(fā)明學(xué)習(xí)和工作的效率。圖像分類任務(wù)關(guān)心整體,給出的是整張圖片的內(nèi)容描述,而檢測(cè)則關(guān)注特定的物體目標(biāo),要求同時(shí)獲得這一目標(biāo)的類別信息和位置信息。相比分類,檢測(cè)給出的是對(duì)圖片前景和背景的理解,本發(fā)明需要從背景中分離出感興趣的目標(biāo),并確定這一目標(biāo)的描述(類別和位置),因此檢測(cè)模型的輸出是一個(gè)列表,列表的每一項(xiàng)使用一個(gè)數(shù)組給出檢出目標(biāo)的類別和位置(常用矩形檢測(cè)框的坐標(biāo)表示)。目標(biāo)檢測(cè)需要同時(shí)解決定位和識(shí)別的問題,傳統(tǒng)的目標(biāo)檢測(cè)方法主要有基于候選區(qū)域的方法、基于端到端的方法等,這些方法一般分為三個(gè)步驟,首先利用不同尺寸的滑動(dòng)窗口框住圖中的某一部分作為候選區(qū)域,其次提取候選區(qū)域相關(guān)的視覺特征,比如人臉檢測(cè)常用的Harr特征,行人檢測(cè)和普通目標(biāo)檢測(cè)常用的HOG特征等,最后利用分類器進(jìn)行識(shí)別。
但是這些方法存在著明顯的缺點(diǎn),需要大量的手動(dòng)注釋對(duì)象進(jìn)行訓(xùn)練或微調(diào),同時(shí)訓(xùn)練需要大量的數(shù)據(jù)集,然而通常情況下同一類圖片的數(shù)據(jù)是比較稀少的,則會(huì)導(dǎo)致訓(xùn)練數(shù)據(jù)分類不足的問題。
發(fā)明內(nèi)容
本發(fā)明是為了解決現(xiàn)有的圖像目標(biāo)檢測(cè)方法中同一類圖片的數(shù)據(jù)少會(huì)導(dǎo)致分類不足問題。
一種基于弱監(jiān)督判別機(jī)制的圖像目標(biāo)檢測(cè)方法,包括以下步驟:
針對(duì)于待檢測(cè)的圖像,利用目標(biāo)檢測(cè)網(wǎng)絡(luò)模型進(jìn)行檢測(cè);所述的目標(biāo)檢測(cè)網(wǎng)絡(luò)模型處理過程包括以下步驟:
首先,將圖像輸入到特征提取網(wǎng)絡(luò)提取特征;
然后,將提取的特征送到CCN網(wǎng)絡(luò)進(jìn)行處理;所述CCN網(wǎng)絡(luò)包括三個(gè)平行的卷積網(wǎng)絡(luò),三個(gè)平行的卷積網(wǎng)絡(luò)分別記為網(wǎng)絡(luò)A、網(wǎng)絡(luò)B和網(wǎng)絡(luò)C,每個(gè)卷積網(wǎng)絡(luò)均包括4個(gè)卷積層、一個(gè)單級(jí)SPP層和一個(gè)FC層,F(xiàn)C層即全連接層;
網(wǎng)絡(luò)A和網(wǎng)絡(luò)B的FC層激活函數(shù)分別采用sigmoid和softmax;將網(wǎng)絡(luò)A中FC層的輸出傳入到網(wǎng)絡(luò)B的spp層,同時(shí)將網(wǎng)絡(luò)B中FC層的輸出傳入到網(wǎng)絡(luò)A的spp層;網(wǎng)絡(luò)C的FC層激活函數(shù)采用sigmoid激活方式,并且FC層之后設(shè)有一個(gè)1×1卷積層;對(duì)于網(wǎng)絡(luò)C,第i個(gè)圖像、第j類得分概率為目標(biāo)總數(shù)為T;
進(jìn)一步地,所述的目標(biāo)檢測(cè)網(wǎng)絡(luò)模型是預(yù)先訓(xùn)練好的,訓(xùn)練過程包括以下步驟:
S1、將訓(xùn)練集中的圖像輸入到特征提取網(wǎng)絡(luò)中提取圖像特征;
S2、將提取的特征送到CCN網(wǎng)絡(luò)進(jìn)行處理;
S3、對(duì)于給定的圖像,對(duì)圖像目標(biāo)進(jìn)行邊框框選,并進(jìn)行目標(biāo)邊框細(xì)化,目標(biāo)邊框細(xì)化的具體包括以下步驟:
四一、首先給出圖像候選目標(biāo),給定一個(gè)圖像實(shí)例I(i),其候選目標(biāo)標(biāo)簽為
Y′=[y1,...,yc,...,yC]T∈(0,1)C,c∈{1,...,C}
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于國家電網(wǎng)有限公司;國網(wǎng)山東省電力公司威海供電公司,未經(jīng)國家電網(wǎng)有限公司;國網(wǎng)山東省電力公司威海供電公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110405637.9/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 在即時(shí)通信中提供即時(shí)監(jiān)督功能的方法及系統(tǒng)
- 一種監(jiān)督事件的生成裝置
- 一種資產(chǎn)托管監(jiān)督任務(wù)的處理方法及裝置
- 一種監(jiān)督方法及裝置
- 基于自監(jiān)督學(xué)習(xí)的標(biāo)簽比例學(xué)習(xí)模型的訓(xùn)練方法和設(shè)備
- 一種衛(wèi)生監(jiān)督對(duì)象尋址方法、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種機(jī)器人表情調(diào)用方法和家用機(jī)器人
- 計(jì)算機(jī)視覺訓(xùn)練系統(tǒng)和用于訓(xùn)練計(jì)算機(jī)視覺系統(tǒng)的方法
- 一種基于廠區(qū)智能管理系統(tǒng)的工廠設(shè)備監(jiān)督系統(tǒng)
- 信息化綜合監(jiān)督系統(tǒng)及方法
- 判別設(shè)備、判別方法和計(jì)算機(jī)程序
- 物體檢測(cè)裝置以及物體檢測(cè)方法
- 圖像處理裝置以及圖像處理方法
- 模擬傳感器的種類判別裝置
- 一種水電站砂層土質(zhì)液化評(píng)判方法
- 基于CNN神經(jīng)網(wǎng)絡(luò)的急性心肌梗死定性自動(dòng)判別系統(tǒng)
- 一種基于CNN神經(jīng)網(wǎng)絡(luò)的急性心肌梗死定位自動(dòng)判別系統(tǒng)
- 一種活體人臉的判別方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 糖網(wǎng)病眼底圖像的樣本數(shù)據(jù)標(biāo)注系統(tǒng)
- 一種循環(huán)漸進(jìn)式局部放電判別方法
- 一種機(jī)制蛋的制造方法
- 手機(jī)制式的校準(zhǔn)方法、系統(tǒng)及手機(jī)檢測(cè)設(shè)備
- 一種考慮激勵(lì)機(jī)制電量電價(jià)彈性矩陣的耗電量估測(cè)方法
- 選擇區(qū)塊鏈共識(shí)機(jī)制的方法、裝置以及共識(shí)節(jié)點(diǎn)
- 一種復(fù)合改性機(jī)制砂及其制備方法
- 一種存儲(chǔ)設(shè)備糾錯(cuò)方法及糾錯(cuò)裝置
- 區(qū)塊鏈中共識(shí)機(jī)制的處理方法、裝置和電子設(shè)備
- 一種建筑用機(jī)制砂整形裝置
- 通信方法、通信裝置及存儲(chǔ)介質(zhì)
- 一種網(wǎng)絡(luò)預(yù)約出租車市場(chǎng)準(zhǔn)入機(jī)制的優(yōu)化方法及系統(tǒng)





