[發(fā)明專利]目標物檢測方法、裝置、終端及存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202210806535.2 | 申請日: | 2022-07-08 |
| 公開(公告)號: | CN116310749A | 公開(公告)日: | 2023-06-23 |
| 發(fā)明(設(shè)計)人: | 胡駿;聶德武;劉威;袁淮;曹斌 | 申請(專利權(quán))人: | 東軟睿馳汽車技術(shù)(沈陽)有限公司 |
| 主分類號: | G06V20/00 | 分類號: | G06V20/00;G06V10/40;G06V10/774;G06V10/82;G06N3/04;G06N3/08 |
| 代理公司: | 北京知帆遠景知識產(chǎn)權(quán)代理有限公司 11890 | 代理人: | 喬海蓮 |
| 地址: | 110172 遼寧*** | 國省代碼: | 遼寧;21 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 目標 檢測 方法 裝置 終端 存儲 介質(zhì) | ||
本申請公開了一種目標物檢測方法、裝置、終端及存儲介質(zhì),方法包括:接收待檢測圖像;將待檢測圖像輸入目標特征提取網(wǎng)絡(luò),得到待檢測圖像對應(yīng)的特征圖;將待檢測圖像對應(yīng)的特征圖輸入目標SSD模型,輸出待檢測圖像中目標物對應(yīng)的多個初始預(yù)測框和多個初始預(yù)測框?qū)?yīng)的多個置信度;基于多個初始預(yù)測框、多個置信度和目標NMS算法,得到目標物的目標預(yù)測框。本發(fā)明根據(jù)圖像中目標物的尺寸大小優(yōu)化SSD模型中l(wèi)oss函數(shù)的計算方法,從而使模型能夠提高小目標的檢測精度,同時對NMS算法的后處理進行優(yōu)化,去除多余的預(yù)測框以確定目標預(yù)測框,提高了目標物的檢測準確度。
技術(shù)領(lǐng)域
本申請涉及圖像處理技術(shù)領(lǐng)域,具體而言,涉及一種目標物檢測方法、裝置、終端及存儲介質(zhì)。
背景技術(shù)
在目標檢測中,通常目標物的識別準確度與攝像頭距離有關(guān)。距離攝像頭較遠的目標物,在圖像中表現(xiàn)為小目標物,如何在準確識別大目標物的同時也能準確識別小目標物成為亟待解決的問題。
目前,針對目標檢測,通常會通過神經(jīng)網(wǎng)絡(luò)算法確定圖像中目標物的邊界框,然后通過后處理中的NMS算法過濾掉多余的邊界框,剩余的邊界框內(nèi)則為目標物。
但是,上述目標檢測方法,難以識別圖像中的小目標物,降低了目標檢測的準確度。
發(fā)明內(nèi)容
本申請的主要目的在于提供一種目標物檢測方法、裝置、終端及存儲介質(zhì),以解決相關(guān)技術(shù)中存在的檢測準確度低的問題。
為了實現(xiàn)上述目的,第一方面,本申請?zhí)峁┝艘环N目標物檢測方法,包括:接收待檢測圖像;
將待檢測圖像輸入目標特征提取網(wǎng)絡(luò),得到待檢測圖像對應(yīng)的特征圖;
將待檢測圖像對應(yīng)的特征圖輸入目標SSD模型,輸出待檢測圖像中目標物對應(yīng)的多個初始預(yù)測框和多個初始預(yù)測框?qū)?yīng)的多個置信度,其中,多個初始預(yù)測框與多個置信度一一對應(yīng);
基于多個初始預(yù)測框、多個置信度和目標NMS算法,得到目標物的目標預(yù)測框。
在一種可能的實現(xiàn)方式中,將待檢測圖像對應(yīng)的特征圖輸入目標SSD模型,輸出待檢測圖像中目標物對應(yīng)的多個初始預(yù)測框和多個初始預(yù)測框?qū)?yīng)的多個置信度之前,還包括:
獲取測試樣本和初始SSD模型,其中,測試樣本中包括多個樣本圖像,多個樣本圖像中的每個樣本圖像中的目標物具有人工標注的真實框;
將測試樣本輸入初始SSD模型中,待初始SSD模型中的Loss函數(shù)對應(yīng)的值達到預(yù)設(shè)值,得到目標SSD模型。
在一種可能的實現(xiàn)方式中,Loss函數(shù)包括第一Loss函數(shù)和第二Loss函數(shù),第一預(yù)測函數(shù)用于對預(yù)測框進行位置預(yù)測,第二Loss函數(shù)用于對目標物進行類型預(yù)測。
在一種可能的實現(xiàn)方式中,第一Loss函數(shù)采用如下公式表示:
其中,Lloc(x,l,c,g)為第一Loss函數(shù)對應(yīng)的值,smoothL1是目標Loss函數(shù);
表示第j個標簽框的寬,表示第j個標簽框的高;
為第一計算結(jié)果,為第二計算結(jié)果;
表示第i個預(yù)測框與第j個目標物類型為k的真實框的匹配結(jié)果;
表示第i個預(yù)測框的中心點的橫坐標、中心點的縱坐標、寬或高;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于東軟睿馳汽車技術(shù)(沈陽)有限公司,未經(jīng)東軟睿馳汽車技術(shù)(沈陽)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210806535.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





