[發(fā)明專利]基于場(chǎng)景語義的目標(biāo)檢測(cè)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)有效
| 申請(qǐng)?zhí)枺?/td> | 202110286154.1 | 申請(qǐng)日: | 2021-03-17 |
| 公開(公告)號(hào): | CN112966697B | 公開(公告)日: | 2022-03-11 |
| 發(fā)明(設(shè)計(jì))人: | 謝雪梅;劉卓;李旭陽 | 申請(qǐng)(專利權(quán))人: | 西安電子科技大學(xué)廣州研究院 |
| 主分類號(hào): | G06V10/44 | 分類號(hào): | G06V10/44;G06V10/764;G06V10/82;G06V10/25;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 廣州三環(huán)專利商標(biāo)代理有限公司 44202 | 代理人: | 麥小嬋;郝傳鑫 |
| 地址: | 510555 廣東省廣州市黃*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 場(chǎng)景 語義 目標(biāo) 檢測(cè) 方法 裝置 設(shè)備 存儲(chǔ) 介質(zhì) | ||
本發(fā)明公開了一種基于場(chǎng)景語義的目標(biāo)檢測(cè)方法、裝置、終端設(shè)備及存儲(chǔ)介質(zhì),該方法包括:構(gòu)建目標(biāo)檢測(cè)模型;將訓(xùn)練圖像輸入特征圖提取網(wǎng)絡(luò)中,得到多尺度特征圖;將多尺度特征圖輸入場(chǎng)景語義特征提取網(wǎng)絡(luò),得到場(chǎng)景語義特征;根據(jù)場(chǎng)景語義特征,計(jì)算場(chǎng)景預(yù)測(cè)的多標(biāo)簽分類損失;將多尺度特征圖輸入候選目標(biāo)特征提取網(wǎng)絡(luò),得到候選目標(biāo)特征集合;將場(chǎng)景語義特征和候選目標(biāo)特征集合輸入融合網(wǎng)絡(luò)進(jìn)行融合,得到新候選目標(biāo)特征集合;再輸入檢測(cè)頭部網(wǎng)絡(luò)進(jìn)行分類與回歸操作,計(jì)算分類損失與回歸損失;聯(lián)合三個(gè)損失函數(shù)對(duì)目標(biāo)檢測(cè)模型進(jìn)行訓(xùn)練;將待測(cè)圖像輸入訓(xùn)練好的目標(biāo)檢測(cè)模型中,得到檢測(cè)結(jié)果。本發(fā)明能解決目前難以識(shí)別具有模糊外觀的目標(biāo)的問題。
技術(shù)領(lǐng)域
本發(fā)明涉及計(jì)算機(jī)視覺圖像目標(biāo)檢測(cè)領(lǐng)域,尤其涉及一種基于場(chǎng)景語義的目標(biāo)檢測(cè)方法、裝置、終端設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù)
在現(xiàn)有的目標(biāo)檢測(cè)方法中,大多通過卷積神經(jīng)網(wǎng)絡(luò)提取待測(cè)目標(biāo)的內(nèi)部特征,再對(duì)提取到的特征進(jìn)行分類,然后實(shí)現(xiàn)對(duì)待測(cè)目標(biāo)的檢測(cè)。但是,這些方法在檢測(cè)過程中卻忽略了全局的場(chǎng)景語義信息,而在現(xiàn)實(shí)場(chǎng)景中,目標(biāo)的出現(xiàn)往往與場(chǎng)景相關(guān),使得現(xiàn)有的目標(biāo)檢測(cè)方法難以識(shí)別具有模糊或不明顯外觀的目標(biāo)。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例的目的是提出一種基于場(chǎng)景語義的目標(biāo)檢測(cè)方法、裝置、終端設(shè)備及存儲(chǔ)介質(zhì),能充分利用場(chǎng)景語義信息,有效解決現(xiàn)有檢測(cè)方法中難以識(shí)別具有模糊外觀的目標(biāo)的問題。
為實(shí)現(xiàn)上述目的,本發(fā)明一實(shí)施例提供了一種基于場(chǎng)景語義的目標(biāo)檢測(cè)方法,包括:
構(gòu)建目標(biāo)檢測(cè)模型;其中,所述目標(biāo)檢測(cè)模型包括特征圖提取網(wǎng)絡(luò)、場(chǎng)景語義特征提取網(wǎng)絡(luò)、候選目標(biāo)特征提取網(wǎng)絡(luò)、融合網(wǎng)絡(luò)和檢測(cè)頭部網(wǎng)絡(luò);
將訓(xùn)練圖像輸入所述特征圖提取網(wǎng)絡(luò)中,得到多尺度特征圖;
將所述多尺度特征圖輸入所述場(chǎng)景語義特征提取網(wǎng)絡(luò),得到場(chǎng)景語義特征;
根據(jù)所述場(chǎng)景語義特征,計(jì)算場(chǎng)景預(yù)測(cè)的多標(biāo)簽分類損失;
將所述多尺度特征圖輸入所述候選目標(biāo)特征提取網(wǎng)絡(luò),得到候選目標(biāo)特征集合;
將所述場(chǎng)景語義特征和所述候選目標(biāo)特征集合輸入所述融合網(wǎng)絡(luò)進(jìn)行融合,得到新候選目標(biāo)特征集合;
將所述新候選目標(biāo)特征集合和所述候選目標(biāo)特征集合輸入所述檢測(cè)頭部網(wǎng)絡(luò)進(jìn)行分類與回歸操作,計(jì)算對(duì)應(yīng)的分類損失與回歸損失;
聯(lián)合所述多標(biāo)簽分類損失、所述分類損失與所述回歸損失對(duì)所述目標(biāo)檢測(cè)模型進(jìn)行訓(xùn)練,得到訓(xùn)練好的目標(biāo)檢測(cè)模型;
將待測(cè)圖像輸入訓(xùn)練好的目標(biāo)檢測(cè)模型中,得到所述待測(cè)圖像中待測(cè)目標(biāo)的類別信息和位置信息。
優(yōu)選地,所述根據(jù)所述場(chǎng)景語義特征,計(jì)算場(chǎng)景預(yù)測(cè)的多標(biāo)簽分類損失,具體包括:
將所述場(chǎng)景語義特征輸入兩層全連接層,輸出場(chǎng)景類別的預(yù)測(cè)值;
根據(jù)計(jì)算場(chǎng)景預(yù)測(cè)的多標(biāo)簽分類損失Lmll;其中,C為目標(biāo)檢測(cè)的類別總數(shù),yc為類別c的目標(biāo)是否出現(xiàn)在圖像中的標(biāo)簽值,為類別c的目標(biāo)是否出現(xiàn)在圖像中的預(yù)測(cè)值。
優(yōu)選地,所述將所述多尺度特征圖輸入所述候選目標(biāo)特征提取網(wǎng)絡(luò),得到候選目標(biāo)特征集合,具體包括:
將所述多尺度特征圖輸入RPN網(wǎng)絡(luò)生成目標(biāo)Proposals,接著進(jìn)行ROI Align操作,接著經(jīng)過兩層全連接層得到所述候選目標(biāo)特征集合;
或者,將所述多尺度特征圖輸入4層卷積網(wǎng)絡(luò),得到所述候選目標(biāo)特征集合。優(yōu)選地,所述將所述場(chǎng)景語義特征和所述候選目標(biāo)特征集合輸入所述融合網(wǎng)絡(luò)進(jìn)行融合,得到新候選目標(biāo)特征集合,具體包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于西安電子科技大學(xué)廣州研究院,未經(jīng)西安電子科技大學(xué)廣州研究院許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110286154.1/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 電視場(chǎng)景切換的方法及電視
- 視頻場(chǎng)景控制系統(tǒng)及方法
- 場(chǎng)景開關(guān)及其場(chǎng)景開關(guān)構(gòu)件和場(chǎng)景圖標(biāo)卡組件
- 場(chǎng)景聯(lián)動(dòng)方法及場(chǎng)景聯(lián)動(dòng)系統(tǒng)
- 一種視頻場(chǎng)景分類方法、裝置、移動(dòng)終端及存儲(chǔ)介質(zhì)
- 一種Unity3D引擎的場(chǎng)景切換方法和系統(tǒng)
- 一種自動(dòng)駕駛場(chǎng)景分類識(shí)別系統(tǒng)及方法
- 一種虛擬場(chǎng)景生成方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 一種汽車圖像場(chǎng)景庫數(shù)據(jù)復(fù)雜度度量方法
- 場(chǎng)景識(shí)別方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 面向語義Web服務(wù)程序設(shè)計(jì)的語義數(shù)據(jù)表示和處理方法
- 一種基于語義的三維模型檢索系統(tǒng)和方法
- 一種計(jì)算機(jī)語義工程系統(tǒng)
- 導(dǎo)航方法及裝置
- 一種分層次多語義網(wǎng)系統(tǒng)及方法
- 一種基于上下文的語義匹配方法和系統(tǒng)
- 遠(yuǎn)程語義識(shí)別方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種基于語義依存關(guān)系的醫(yī)療文本標(biāo)注方法
- 基于多級(jí)語義表征和語義計(jì)算的信號(hào)語義識(shí)別方法
- 語義分類方法及裝置、存儲(chǔ)介質(zhì)及電子設(shè)備
- 目標(biāo)檢測(cè)裝置、學(xué)習(xí)裝置、目標(biāo)檢測(cè)系統(tǒng)及目標(biāo)檢測(cè)方法
- 目標(biāo)監(jiān)測(cè)方法、目標(biāo)監(jiān)測(cè)裝置以及目標(biāo)監(jiān)測(cè)程序
- 目標(biāo)監(jiān)控系統(tǒng)及目標(biāo)監(jiān)控方法
- 目標(biāo)跟蹤方法和目標(biāo)跟蹤設(shè)備
- 目標(biāo)跟蹤方法和目標(biāo)跟蹤裝置
- 目標(biāo)檢測(cè)方法和目標(biāo)檢測(cè)裝置
- 目標(biāo)跟蹤方法、目標(biāo)跟蹤裝置、目標(biāo)跟蹤設(shè)備
- 目標(biāo)處理方法、目標(biāo)處理裝置、目標(biāo)處理設(shè)備及介質(zhì)
- 目標(biāo)處理方法、目標(biāo)處理裝置、目標(biāo)處理設(shè)備及介質(zhì)
- 目標(biāo)跟蹤系統(tǒng)及目標(biāo)跟蹤方法





