[發(fā)明專利]基于目標(biāo)檢測(cè)網(wǎng)絡(luò)的多標(biāo)簽物體檢測(cè)方法、系統(tǒng)、裝置在審
| 申請(qǐng)?zhí)枺?/td> | 201910172679.5 | 申請(qǐng)日: | 2019-03-07 |
| 公開(kāi)(公告)號(hào): | CN109858569A | 公開(kāi)(公告)日: | 2019-06-07 |
| 發(fā)明(設(shè)計(jì))人: | 楊國(guó)棟;田雨農(nóng);李恩;梁自澤;譚民;景奉水;高子舒;王昊;孫苑淞;陸偲蓰 | 申請(qǐng)(專利權(quán))人: | 中國(guó)科學(xué)院自動(dòng)化研究所 |
| 主分類號(hào): | G06K9/62 | 分類號(hào): | G06K9/62;G06N3/04 |
| 代理公司: | 北京市恒有知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11576 | 代理人: | 郭文浩;尹文會(huì) |
| 地址: | 100190 *** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 待檢測(cè)物體 目標(biāo)檢測(cè) 檢測(cè) 標(biāo)簽物體 輸入圖像 中心坐標(biāo) 矩形框 計(jì)算機(jī)視覺(jué)領(lǐng)域 類別目標(biāo) 網(wǎng)絡(luò) 遮擋 圖像 輸出 | ||
本發(fā)明屬于計(jì)算機(jī)視覺(jué)領(lǐng)域,具體涉及了一種基于目標(biāo)檢測(cè)網(wǎng)絡(luò)的多標(biāo)簽物體檢測(cè)方法、系統(tǒng)、裝置,旨在解決現(xiàn)有目標(biāo)檢測(cè)技術(shù)精度較低,不能很好地解決多標(biāo)簽物體實(shí)時(shí)準(zhǔn)確地檢測(cè)的問(wèn)題。本發(fā)明方法包括:獲取待檢測(cè)物體的圖像作為輸入圖像;采用訓(xùn)練后的目標(biāo)檢測(cè)網(wǎng)絡(luò),依據(jù)輸入圖像獲取待檢測(cè)物體的類別以及待檢測(cè)物體中心坐標(biāo)、檢測(cè)矩形框長(zhǎng)度和寬度;輸出待檢測(cè)物體的類別以及待檢測(cè)物體中心坐標(biāo)、檢測(cè)矩形框長(zhǎng)度和寬度。本發(fā)明方法實(shí)現(xiàn)了對(duì)不同類別目標(biāo)的實(shí)時(shí)、精確檢測(cè),提高了檢測(cè)的速度和精度,并且可以對(duì)目標(biāo)檢測(cè)中相互重疊、存在遮擋的情況進(jìn)行很好的處理。
技術(shù)領(lǐng)域
本發(fā)明屬于計(jì)算機(jī)視覺(jué)領(lǐng)域,具體涉及了一種基于目標(biāo)檢測(cè)網(wǎng)絡(luò)的多標(biāo)簽物體檢測(cè)方法、系統(tǒng)、裝置。
背景技術(shù)
隨著人工智能、機(jī)器學(xué)習(xí)技術(shù)的迅速發(fā)展和日趨成熟,自主目標(biāo)檢測(cè)技術(shù)成為了近年來(lái)國(guó)內(nèi)外深度學(xué)習(xí)研究的熱點(diǎn)問(wèn)題,在智能交通、醫(yī)學(xué)圖像處理、機(jī)器人技術(shù)、農(nóng)業(yè)物聯(lián)網(wǎng)方面擁有著廣泛的應(yīng)用前景。現(xiàn)實(shí)生活中,物體種類繁多、個(gè)體分布方式復(fù)雜,人類可以通過(guò)感知物體形狀、顏色、紋理和距離等信息,準(zhǔn)確判斷物體的類別和位置,但這對(duì)于計(jì)算機(jī)視覺(jué)來(lái)說(shuō)是極大的挑戰(zhàn)。因此,使計(jì)算機(jī)擁有與人類相似甚至超過(guò)人類的目標(biāo)檢測(cè)能力,已經(jīng)成為當(dāng)前目標(biāo)檢測(cè)技術(shù)的重要方向和主要挑戰(zhàn)。
目標(biāo)檢測(cè)的主要研究方法是提取目標(biāo)顏色、形狀、紋理等特征實(shí)現(xiàn)目標(biāo)描述,然后利用一定的機(jī)器學(xué)習(xí)算法進(jìn)行目標(biāo)類型和目標(biāo)位置、輪廓的學(xué)習(xí),最后對(duì)目標(biāo)進(jìn)行分類、定位及畫框,實(shí)現(xiàn)目標(biāo)檢測(cè)。但是待檢測(cè)的目標(biāo)存在類內(nèi)差異大、類間相似度高的情況,這種情況下提取的特征通常很難反映出類間差異和類內(nèi)共性。尤其在物體具有多個(gè)標(biāo)簽的情況下,由于傳統(tǒng)特征提取方式的限制,不同標(biāo)簽所使用的特征之間往往是沒(méi)有關(guān)聯(lián)的,這使物體識(shí)別起來(lái)更加困難。在實(shí)際目標(biāo)檢測(cè)的過(guò)程中,目標(biāo)物之間的相互重疊、存在遮擋等情況使得目標(biāo)類間分類邊界不明顯,類內(nèi)區(qū)分困難,這也對(duì)目標(biāo)的實(shí)際檢測(cè)帶來(lái)很大的挑戰(zhàn)。
多標(biāo)簽物體檢測(cè)問(wèn)題目前主要依靠?jī)煞N類型的方法來(lái)處理。一種是基于傳統(tǒng)圖像處理的方法,首先對(duì)物體圖像提取一些Haar、SIFT、HOG、SURF、DPM等特征,然后采用傳統(tǒng)的分類器獲取物體類別的預(yù)測(cè)結(jié)果及位置信息,該方法的識(shí)別速度比較快,但是識(shí)別準(zhǔn)確率比較低,并且特征一般由人工提取,工作量大、不具備普適性;另一種是使用深度學(xué)習(xí)方法進(jìn)行目標(biāo)檢測(cè)。目前的深度學(xué)習(xí)的目標(biāo)檢測(cè)方法主要分為兩類:一類是以R-CNN為代表的基于候選區(qū)域的目標(biāo)檢測(cè)網(wǎng)絡(luò),在精度和速度上有了很大的提升,但在高分辨率圖像檢測(cè)問(wèn)題上難以實(shí)現(xiàn)實(shí)時(shí)檢測(cè);一類是以YOLO為代表的將目標(biāo)檢測(cè)問(wèn)題轉(zhuǎn)換為回歸問(wèn)題的目標(biāo)檢測(cè)網(wǎng)絡(luò),檢測(cè)速度快,但算法檢測(cè)精度略低。
總的來(lái)說(shuō),雖然該領(lǐng)域提出了很多目標(biāo)檢測(cè)網(wǎng)絡(luò),但無(wú)法兼顧檢測(cè)速度與精度的要求,不能取得理想的結(jié)果。
發(fā)明內(nèi)容
為了解決現(xiàn)有技術(shù)中的上述問(wèn)題,即現(xiàn)有目標(biāo)檢測(cè)技術(shù)不能兼顧檢測(cè)速度和高精度要求的問(wèn)題,本發(fā)明提供了一種基于目標(biāo)檢測(cè)網(wǎng)絡(luò)的多標(biāo)簽物體檢測(cè)方法,包括:
步驟S10,獲取待檢測(cè)物體的圖像作為輸入圖像;
步驟S20,基于訓(xùn)練后的目標(biāo)檢測(cè)網(wǎng)絡(luò),依據(jù)所述輸入圖像,獲取待檢測(cè)物體的類別以及待檢測(cè)物體中心坐標(biāo)、檢測(cè)矩形框長(zhǎng)度和寬度;
步驟S30,輸出待檢測(cè)物體的類別以及待檢測(cè)物體中心坐標(biāo)、檢測(cè)矩形框長(zhǎng)度和寬度;
其中,所述的目標(biāo)檢測(cè)網(wǎng)絡(luò),為采用密集連接卷積網(wǎng)絡(luò)替代YOLO-V3網(wǎng)絡(luò)中分辨率低的特征層所得到的網(wǎng)絡(luò)。
在一些優(yōu)選的實(shí)施例中,所述目標(biāo)檢測(cè)網(wǎng)絡(luò)的訓(xùn)練步驟為:
步驟B10,將獲取的訓(xùn)練圖像集中每一個(gè)圖像根據(jù)標(biāo)準(zhǔn)格式調(diào)整圖像屬性,獲得標(biāo)準(zhǔn)化訓(xùn)練圖像集;
步驟B20,采用所述目標(biāo)檢測(cè)網(wǎng)絡(luò)檢測(cè)標(biāo)準(zhǔn)化訓(xùn)練圖像集中一個(gè)批次的圖像,并計(jì)算所述目標(biāo)檢測(cè)網(wǎng)絡(luò)各分類器的訓(xùn)練誤差值;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國(guó)科學(xué)院自動(dòng)化研究所,未經(jīng)中國(guó)科學(xué)院自動(dòng)化研究所許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910172679.5/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書(shū)寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 檢測(cè)裝置、檢測(cè)方法和檢測(cè)組件
- 檢測(cè)方法、檢測(cè)裝置和檢測(cè)系統(tǒng)
- 檢測(cè)裝置、檢測(cè)方法以及記錄介質(zhì)
- 檢測(cè)設(shè)備、檢測(cè)系統(tǒng)和檢測(cè)方法
- 檢測(cè)芯片、檢測(cè)設(shè)備、檢測(cè)系統(tǒng)和檢測(cè)方法
- 檢測(cè)裝置、檢測(cè)設(shè)備及檢測(cè)方法
- 檢測(cè)芯片、檢測(cè)設(shè)備、檢測(cè)系統(tǒng)
- 檢測(cè)組件、檢測(cè)裝置以及檢測(cè)系統(tǒng)
- 檢測(cè)裝置、檢測(cè)方法及檢測(cè)程序
- 檢測(cè)電路、檢測(cè)裝置及檢測(cè)系統(tǒng)





