[發(fā)明專利]一種基于CNN的檢測器、圖像檢測方法及終端有效
| 申請?zhí)枺?/td> | 201811628821.4 | 申請日: | 2018-12-28 |
| 公開(公告)號: | CN111382761B | 公開(公告)日: | 2023-04-07 |
| 發(fā)明(設(shè)計)人: | 劉陽;羅小偉;林福輝 | 申請(專利權(quán))人: | 展訊通信(天津)有限公司 |
| 主分類號: | G06V10/774 | 分類號: | G06V10/774;G06V10/82;G06N3/045;G06N3/0464 |
| 代理公司: | 北京集佳知識產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 武振華;吳敏 |
| 地址: | 300456 天津市濱海新*** | 國省代碼: | 天津;12 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 cnn 檢測器 圖像 檢測 方法 終端 | ||
一種基于CNN的檢測器、圖像檢測方法及終端,所述檢測器包括:基礎(chǔ)網(wǎng)絡(luò);特征提取模塊;其中,所述基礎(chǔ)網(wǎng)絡(luò)包括第一子網(wǎng)絡(luò)以及第二子網(wǎng)絡(luò);所述第一子網(wǎng)絡(luò)包括多組第一重復(fù)模塊,且前一組第一重復(fù)模塊的數(shù)據(jù)輸出至后一組第一重復(fù)模塊,每組第一重復(fù)子模塊均包括用于串聯(lián)運算的分離串聯(lián)模塊以及用于傳遞運算的第一傳遞模塊,所述第一子網(wǎng)絡(luò)輸出第一路特征層數(shù)據(jù)至所述第二子網(wǎng)絡(luò);所述第二子網(wǎng)絡(luò)包括多組第二重復(fù)模塊,且前一組第二重復(fù)模塊的數(shù)據(jù)輸出至后一組第二重復(fù)模塊,每組第二重復(fù)子模塊均包括所述分離串聯(lián)模塊以及用于傳遞運算的第二傳遞模塊。本發(fā)明方案可以提高特征提取精度,且更有機會適用于移動端或嵌入式設(shè)備。
技術(shù)領(lǐng)域
本發(fā)明涉及檢測技術(shù)領(lǐng)域,尤其涉及一種基于CNN的檢測器、圖像檢測方法及終端。
背景技術(shù)
物體檢測是對圖像或視頻數(shù)據(jù)進行分析,判斷是否存在某些物體(如行人,汽車或各種商品等)并給出這些物體的具體位置。物體檢測是計算機視覺領(lǐng)域的關(guān)鍵技術(shù),廣泛應(yīng)用于安防監(jiān)控、自動駕駛和智能硬件等領(lǐng)域,是后續(xù)的行為分析、語義解析等高階任務(wù)的前提。
傳統(tǒng)的物體檢測方法里,影響力最大的是自提升級聯(lián)模型(Ada-Boost?CascadedModel)和基于部件的變形模型(Deformable?Part-based?Model,DPM)。前者主要適用于人臉檢測,后者則成功應(yīng)用于行人檢測,但其檢測精度和魯棒性已被基于卷積神經(jīng)網(wǎng)絡(luò)(Convolutional?Neural?Network,CNN)的深度學(xué)習(xí)方法超越。
目前,基于CNN的深度學(xué)習(xí)方法被廣泛應(yīng)用在物體檢測領(lǐng)域,可以分為兩類:第一類是基于物體候選窗口的方法,典型代表是更快速基于區(qū)域的卷積神經(jīng)網(wǎng)絡(luò)(FasterRegions?with?CNN,Faster?R-CNN)檢測器,第二類則是候選窗口無關(guān)(Proposal?Free)的方法,典型代表是實時目標(You?Only?Look?Once,YOLO)檢測器和單次多窗口檢測器(Single?Shot?Multi-Box?Detector,SSD)。
然而,物體檢測精度很大程度上依賴于圖像數(shù)據(jù)的特征提取。圖像數(shù)據(jù)的特征提取方法依靠圖像卷積提取顯著特征。現(xiàn)有的圖像卷積方法提取圖像特征計算復(fù)雜度較高,耗時較長,難以適用于移動端或嵌入式設(shè)備。
發(fā)明內(nèi)容
本發(fā)明解決的技術(shù)問題是提供一種基于CNN的檢測器、圖像檢測方法及終端,可以提高特征提取精度,能夠一次性訓(xùn)練,同時可以降低訓(xùn)練難度,并且在保證檢測精度的基礎(chǔ)上,設(shè)計出模型參數(shù)量更小的網(wǎng)絡(luò)結(jié)構(gòu),更有機會適用于移動端或嵌入式設(shè)備。
為解決上述技術(shù)問題,本發(fā)明實施例提供一種基于CNN的檢測器,包括:基礎(chǔ)網(wǎng)絡(luò),用于對輸入的圖像進行特征提取,并輸出至少一路特征層數(shù)據(jù);特征提取模塊,所述特征提取模塊的輸入端與所述基礎(chǔ)網(wǎng)絡(luò)的輸出端耦接,包括至少一路卷積子模塊,所述至少一路卷積子模塊用于對所述至少一路特征層數(shù)據(jù)進行卷積運算后分別輸出至預(yù)測層;其中,所述基礎(chǔ)網(wǎng)絡(luò)包括第一子網(wǎng)絡(luò)以及第二子網(wǎng)絡(luò);所述第一子網(wǎng)絡(luò)包括多組第一重復(fù)模塊,且前一組第一重復(fù)模塊的數(shù)據(jù)輸出至后一組第一重復(fù)模塊,每組第一重復(fù)子模塊均包括用于串聯(lián)運算的分離串聯(lián)模塊以及用于傳遞運算的第一傳遞模塊,所述第一子網(wǎng)絡(luò)輸出第一路特征層數(shù)據(jù)至所述第二子網(wǎng)絡(luò);所述第二子網(wǎng)絡(luò)包括多組第二重復(fù)模塊,且前一組第二重復(fù)模塊的數(shù)據(jù)輸出至后一組第二重復(fù)模塊,每組第二重復(fù)子模塊均包括所述分離串聯(lián)模塊以及用于傳遞運算的第二傳遞模塊,所述第二子網(wǎng)絡(luò)輸出第二路特征層數(shù)據(jù)。
可選的,所述分離串聯(lián)模塊包括多個分離串聯(lián)子模塊,且前一個分離串聯(lián)子模塊的數(shù)據(jù)輸出至后一個分離串聯(lián)子模塊;其中,每個分離串聯(lián)子模塊包括:串聯(lián)模塊;連接的卷積模塊以及分離卷積模塊,所述卷積模塊用于接收輸入至所述分離串聯(lián)子模塊的數(shù)據(jù),并進行卷積處理后輸出至所述分離卷積模塊,以使所述分離卷積模塊進行分離卷積處理后輸出待串聯(lián)數(shù)據(jù)至所述串聯(lián)模塊;其中,所述串聯(lián)模塊對所述輸入至所述分離串聯(lián)子模塊的數(shù)據(jù)和所述待串聯(lián)數(shù)據(jù)進行串聯(lián)處理后的輸出數(shù)據(jù)作為所述分離串聯(lián)子模塊的輸出數(shù)據(jù),且最后一個分離串聯(lián)子模塊的輸出數(shù)據(jù)作為所述分離串聯(lián)模塊的輸出數(shù)據(jù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于展訊通信(天津)有限公司,未經(jīng)展訊通信(天津)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811628821.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 圖像語義標注的設(shè)備和方法及其模型的生成方法和系統(tǒng)
- 使用卷積神經(jīng)網(wǎng)絡(luò)的數(shù)字圖像處理
- 為數(shù)據(jù)庫確定卷積神經(jīng)網(wǎng)絡(luò)CNN模型的裝置和方法
- 確定卷積神經(jīng)網(wǎng)絡(luò)CNN模型的裝置和方法
- 采用嵌入式系統(tǒng)中的小規(guī)模卷積神經(jīng)網(wǎng)絡(luò)模塊的人臉檢測
- 針對深度通道和卷積神經(jīng)網(wǎng)絡(luò)圖像和格式使用相機設(shè)備的方法和系統(tǒng)
- 處理卷積神經(jīng)網(wǎng)絡(luò)的方法
- CNN加速器和電子設(shè)備
- 一種基于混合神經(jīng)網(wǎng)絡(luò)的腦電時空特征學(xué)習(xí)與情感分類方法
- 一種基于FPGA的深度學(xué)習(xí)加速方法
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





