[發(fā)明專利]一種基于深度學(xué)習(xí)的目標(biāo)檢測方法和裝置有效
| 申請?zhí)枺?/td> | 201810397400.9 | 申請日: | 2018-04-28 |
| 公開(公告)號: | CN108596120B | 公開(公告)日: | 2021-01-26 |
| 發(fā)明(設(shè)計)人: | 董玉新;劉巍;陳宇;翁志 | 申請(專利權(quán))人: | 北京京東尚科信息技術(shù)有限公司;北京京東世紀(jì)貿(mào)易有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06T3/40;G06T11/40 |
| 代理公司: | 中原信達(dá)知識產(chǎn)權(quán)代理有限責(zé)任公司 11219 | 代理人: | 張一軍;張效榮 |
| 地址: | 100195 北京市海淀區(qū)杏石口路6*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 深度 學(xué)習(xí) 目標(biāo) 檢測 方法 裝置 | ||
本發(fā)明公開了一種基于深度學(xué)習(xí)的目標(biāo)檢測方法和裝置,涉及計算機技術(shù)領(lǐng)域。該方法的一具體實施方式包括:根據(jù)預(yù)先確定的縮放級數(shù)和每一級縮放的縮放尺度,對原始圖像進行縮放,以得到每一級縮放圖像;根據(jù)縮放級數(shù)和第一級縮放圖像的尺寸,生成至少一個圖像空間;當(dāng)圖像空間的尺寸大于第一級縮放圖像的尺寸時,將每一級縮放圖像的顏色值分別填充到對應(yīng)的圖像空間中;將填充有顏色值的圖像空間批量輸入全卷積網(wǎng)絡(luò),以輸出目標(biāo)檢測結(jié)果。該方法通過對原始圖像進行多次縮放,將縮放圖像的顏色值填充至同一尺寸的圖像空間,并將所有的圖像空間批量輸入全卷積網(wǎng)絡(luò),使得本申請僅需要進行一次前向推理,在保證召回率的同時,提升了檢測速度。
技術(shù)領(lǐng)域
本發(fā)明涉及計算機領(lǐng)域,尤其涉及一種基于深度學(xué)習(xí)的目標(biāo)檢測方法和裝置。
背景技術(shù)
現(xiàn)有的人臉檢測方法中包括基于級聯(lián)卷積神經(jīng)網(wǎng)絡(luò)(Convolutional NeuralNetwork,CNN)的深度學(xué)習(xí)人臉檢測算法,該算法需要對輸入的原始圖像進行不同尺度的縮放處理。該算法的第一個階段的具體處理過程為:首先根據(jù)預(yù)先確定的縮放尺度,對原始圖像進行第一級縮放,將第一級縮放后得到的圖像輸入第一級網(wǎng)絡(luò),以生成候選框和邊框回歸向量;之后根據(jù)所述縮放尺度進行下一級縮放,將該級縮放后得到的圖像輸入第一級網(wǎng)絡(luò),以生成候選框和邊框回歸向量,依此循環(huán)。
在實現(xiàn)本發(fā)明過程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)中至少存在如下問題:由于基于級聯(lián)CNN的深度學(xué)習(xí)人臉檢測算法需要對原始圖像進行不同尺度的縮放處理,使得第一級網(wǎng)絡(luò)需要進行多次前向推理的過程(即將縮放圖像輸入第一級網(wǎng)絡(luò)進行計算,并得到輸出的過程),這樣會導(dǎo)致第一級網(wǎng)絡(luò)的處理時間占用整個檢測過程的70%以上,降低了檢測速度。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明實施例提供一種基于深度學(xué)習(xí)的目標(biāo)檢測方法和裝置,本發(fā)明實施例通過對原始圖像進行多次縮放,將縮放圖像的顏色值填充至同一尺寸的圖像空間,并將所有的圖像空間批量輸入全卷積網(wǎng)絡(luò),使得本申請僅需要進行一次前向推理,在保證召回率的同時,提升了檢測速度。
為實現(xiàn)上述目的,根據(jù)本發(fā)明實施例的一個方面,提供了一種基于深度學(xué)習(xí)的目標(biāo)檢測方法。
本發(fā)明實施例的一種基于深度學(xué)習(xí)的目標(biāo)檢測方法,包括:根據(jù)預(yù)先確定的縮放級數(shù)和每一級縮放的縮放尺度,對原始圖像進行縮放,以得到每一級縮放圖像;根據(jù)所述縮放級數(shù)和第一級縮放圖像的尺寸,生成至少一個圖像空間;當(dāng)所述圖像空間的尺寸大于所述第一級縮放圖像的尺寸時,將所述每一級縮放圖像的顏色值分別填充到對應(yīng)的所述圖像空間中;將填充有顏色值的所述圖像空間批量輸入全卷積網(wǎng)絡(luò),以輸出目標(biāo)檢測結(jié)果。
可選地,所述對原始圖像進行縮放的步驟之前,還包括:根據(jù)所述原始圖像的像素和目標(biāo)像素,確定所述縮放級數(shù)和每一級縮放的縮放尺度。
可選地,所述根據(jù)所述縮放級數(shù)和第一級縮放圖像的尺寸,生成至少一個的圖像空間,包括:根據(jù)第一級縮放圖像的尺寸,生成與所述第一級縮放圖像的尺寸相同的圖像空間,且生成的所述圖像空間的個數(shù)比所述縮放級數(shù)少1;所述方法還包括:當(dāng)所述圖像空間的尺寸等于所述第一級縮放圖像的尺寸時,將縮放級數(shù)大于1的所有縮放圖像的顏色值分別填充到對應(yīng)的所述圖像空間中。
可選地,所述將填充有顏色值的所述圖像空間批量輸入全卷積網(wǎng)絡(luò),包括:將填充有顏色值的所述圖像空間和所述第一級縮放圖像批量輸入所述全卷積網(wǎng)絡(luò)。
可選地,所述生成至少一個的圖像空間的步驟之后,還包括:對所有的所述圖像空間分別進行零填充;所述將所述每一級縮放圖像的顏色值分別填充到對應(yīng)的所述圖像空間中,包括:將所述每一級縮放圖像的顏色值分別填充到對應(yīng)的零填充后的所述圖像空間中。
可選地,所述將填充有顏色值的所述圖像空間批量輸入全卷積網(wǎng)絡(luò)的步驟之前,還包括:對填充有顏色值的所述圖像空間中,未填充顏色值的區(qū)域分別進行零填充。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京京東尚科信息技術(shù)有限公司;北京京東世紀(jì)貿(mào)易有限公司,未經(jīng)北京京東尚科信息技術(shù)有限公司;北京京東世紀(jì)貿(mào)易有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810397400.9/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 根據(jù)用戶學(xué)習(xí)效果動態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個人化學(xué)習(xí)服務(wù)的方法
- 漸進式學(xué)習(xí)管理方法及漸進式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲介質(zhì)
- 基于強化學(xué)習(xí)的自適應(yīng)移動學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲介質(zhì)
- 游戲?qū)W習(xí)效果評測方法及系統(tǒng)
- 目標(biāo)檢測裝置、學(xué)習(xí)裝置、目標(biāo)檢測系統(tǒng)及目標(biāo)檢測方法
- 目標(biāo)監(jiān)測方法、目標(biāo)監(jiān)測裝置以及目標(biāo)監(jiān)測程序
- 目標(biāo)監(jiān)控系統(tǒng)及目標(biāo)監(jiān)控方法
- 目標(biāo)跟蹤方法和目標(biāo)跟蹤設(shè)備
- 目標(biāo)跟蹤方法和目標(biāo)跟蹤裝置
- 目標(biāo)檢測方法和目標(biāo)檢測裝置
- 目標(biāo)跟蹤方法、目標(biāo)跟蹤裝置、目標(biāo)跟蹤設(shè)備
- 目標(biāo)處理方法、目標(biāo)處理裝置、目標(biāo)處理設(shè)備及介質(zhì)
- 目標(biāo)處理方法、目標(biāo)處理裝置、目標(biāo)處理設(shè)備及介質(zhì)
- 目標(biāo)跟蹤系統(tǒng)及目標(biāo)跟蹤方法





