[發(fā)明專利]基于深度學(xué)習(xí)的定位方法和系統(tǒng)在審
| 申請(qǐng)?zhí)枺?/td> | 201910140228.3 | 申請(qǐng)日: | 2019-02-26 |
| 公開(公告)號(hào): | CN109977945A | 公開(公告)日: | 2019-07-05 |
| 發(fā)明(設(shè)計(jì))人: | 孟健;紀(jì)國強(qiáng);戴維倫;湯興粲;劉勝波;王會(huì)玲 | 申請(qǐng)(專利權(quán))人: | 博眾精工科技股份有限公司 |
| 主分類號(hào): | G06K9/32 | 分類號(hào): | G06K9/32;G06N3/04;G06N3/08 |
| 代理公司: | 蘇州創(chuàng)元專利商標(biāo)事務(wù)所有限公司 32103 | 代理人: | 范晴;丁浩秋 |
| 地址: | 215000 江蘇省蘇州*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 卷積神經(jīng)網(wǎng)絡(luò) 候選框 篩選 構(gòu)建 錨框 抓取 機(jī)械手 定點(diǎn)坐標(biāo) 候選區(qū)域 候選網(wǎng)絡(luò) 角度信息 旋轉(zhuǎn)定位 最優(yōu)模型 偏移量 旋轉(zhuǎn)框 映射 學(xué)習(xí) 標(biāo)注 標(biāo)簽 采集 圖像 輸出 分類 預(yù)測(cè) | ||
1.一種基于深度學(xué)習(xí)的定位方法,其特征在于,包括以下步驟:
S01:構(gòu)建基礎(chǔ)卷積神經(jīng)網(wǎng)絡(luò),通過基礎(chǔ)卷積神經(jīng)網(wǎng)絡(luò)提取采集的圖像的深度學(xué)習(xí)特征;
S02:構(gòu)建區(qū)域候選網(wǎng)絡(luò),篩選初步候選錨框確定前景和背景標(biāo)簽,計(jì)算標(biāo)注數(shù)據(jù)與篩選后的錨框之間的偏移量;
S03:根據(jù)基礎(chǔ)卷積神經(jīng)網(wǎng)絡(luò)輸出的特征映射生成旋轉(zhuǎn)矩形局域候選框,所述旋轉(zhuǎn)矩形局域候選框使用兩個(gè)定點(diǎn)坐標(biāo)和高度表示;
S04:根據(jù)旋轉(zhuǎn)矩形局域候選框的旋轉(zhuǎn)矩形的交并比篩選候選區(qū)域,計(jì)算分類損失、預(yù)測(cè)旋轉(zhuǎn)框的坐標(biāo)和角度損失,得到最優(yōu)模型參數(shù)進(jìn)行定位。
2.根據(jù)權(quán)利要求1所述的基于深度學(xué)習(xí)的定位方法,其特征在于,所述步驟S02包括:
S21:根據(jù)基礎(chǔ)卷積神經(jīng)網(wǎng)絡(luò)輸出的特征映射生成初步候選錨框,得到圖像每個(gè)位置所需候選錨框數(shù)目為:
num_anchor=n*m*ration*scaler
其中,n、m、ration、scaler分別表示輸出特征映射的長、寬、生成錨框的不同長寬比、生成錨框的不同尺度;
S22:篩選初步候選錨框,計(jì)算所有錨框和與標(biāo)注數(shù)據(jù)中的物體外接矩形框的交并比(IOU),若IOU>0.7則標(biāo)記為前景,若IOU<0.3則標(biāo)記為背景,丟棄其他的錨框;
S23:進(jìn)一步抑制錨框的數(shù)量;
S24:計(jì)算物體的標(biāo)注數(shù)據(jù)與篩選后的錨框之間的偏移量
S25:使用損失函數(shù)smoothl1計(jì)算預(yù)測(cè)坐標(biāo)的偏移量ti,構(gòu)建計(jì)算錨框偏移損失:
其中,x、y表示錨框的中心坐標(biāo),w、h分別為錨框的寬高的偏移;
S26:使用交叉熵?fù)p損失函數(shù)構(gòu)建前景與背景的分類損失;
S27:通過反向傳播微調(diào),得到感興趣區(qū)域的坐標(biāo)[x_c,y_c,w,h]。
3.根據(jù)權(quán)利要求2所述的基于深度學(xué)習(xí)的定位方法,其特征在于,所述步驟S23中進(jìn)一步抑制錨框的數(shù)量,包括:
S231:將標(biāo)記為前景的候選錨框根據(jù)IOU值進(jìn)行排序,選取排序靠前的一定數(shù)量的錨框;
S232:去掉超邊界的候選錨框;
S233:根據(jù)非極大值抑制方法繼續(xù)剔除錨框,得到一定數(shù)量的錨框。
4.根據(jù)權(quán)利要求1所述的基于深度學(xué)習(xí)的定位方法,其特征在于,所述步驟S04中,篩選候選區(qū)域后,對(duì)篩選候選區(qū)域使用非極大值抑制,對(duì)抑制后的感興趣區(qū)域進(jìn)行分類和邊界框回歸,在邊界框回歸時(shí)增加角度信息。
5.根據(jù)權(quán)利要求1所述的基于深度學(xué)習(xí)的定位方法,其特征在于,所述步驟S04中,計(jì)算分類損失、預(yù)測(cè)旋轉(zhuǎn)框的坐標(biāo)和角度損失的公式為:
其中,Lcls(p,t)為分類損失,λ1,λ2為權(quán)重系數(shù),t為類別標(biāo)簽,當(dāng)預(yù)測(cè)目標(biāo)為前景時(shí)t=1,為背景時(shí)t=0,vi=(vx,vy,vw,vh),ui=(ux1,,uy1,ux2,uy2,uh)分別為真實(shí)的矩形標(biāo)注數(shù)據(jù)與旋轉(zhuǎn)矩形標(biāo)注數(shù)據(jù),分別為網(wǎng)絡(luò)預(yù)測(cè)的物體矩形與旋轉(zhuǎn)矩形區(qū)域。
6.一種基于深度學(xué)習(xí)的定位系統(tǒng),其特征在于,包括:
一圖像特征提取模塊:構(gòu)建基礎(chǔ)卷積神經(jīng)網(wǎng)絡(luò),通過基礎(chǔ)卷積神經(jīng)網(wǎng)絡(luò)提取采集的圖像的深度學(xué)習(xí)特征;
一區(qū)域候選網(wǎng)絡(luò)構(gòu)建模塊:構(gòu)建區(qū)域候選網(wǎng)絡(luò),篩選初步候選錨框確定前景和背景標(biāo)簽,計(jì)算標(biāo)注數(shù)據(jù)與篩選后的錨框之間的偏移量;
一旋轉(zhuǎn)矩形局域候選框構(gòu)建模塊:根據(jù)基礎(chǔ)卷積神經(jīng)網(wǎng)絡(luò)輸出的特征映射生成旋轉(zhuǎn)矩形局域候選框,所述旋轉(zhuǎn)矩形局域候選框使用兩個(gè)定點(diǎn)坐標(biāo)和高度表示;
一模型優(yōu)化定位模塊:根據(jù)旋轉(zhuǎn)矩形局域候選框的旋轉(zhuǎn)矩形的交并比篩選候選區(qū)域,計(jì)算分類損失、預(yù)測(cè)旋轉(zhuǎn)框的坐標(biāo)和角度損失,得到最優(yōu)模型參數(shù)進(jìn)行定位。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于博眾精工科技股份有限公司,未經(jīng)博眾精工科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910140228.3/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 終端卷積神經(jīng)網(wǎng)絡(luò)的處理方法、裝置、存儲(chǔ)介質(zhì)及處理器
- 一種基于卷積神經(jīng)網(wǎng)絡(luò)的圖像深度估計(jì)方法
- 卷積神經(jīng)網(wǎng)絡(luò)的生成方法及裝置
- 一種卷積神經(jīng)網(wǎng)絡(luò)硬件模塊部署方法
- 卷積神經(jīng)網(wǎng)絡(luò)的處理方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法及裝置
- 一種基于通道數(shù)搜索卷積神經(jīng)網(wǎng)絡(luò)的方法
- 卷積神經(jīng)網(wǎng)絡(luò)處理方法、裝置和電子系統(tǒng)
- 一種基于空洞卷積循環(huán)神經(jīng)網(wǎng)絡(luò)的聲音事件檢測(cè)方法
- 基于稀疏卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)方法及檢測(cè)裝置
- 一種自適應(yīng)非極大抑制的目標(biāo)檢測(cè)方法
- 一種緊湊雙車牌檢測(cè)方法及裝置
- 基于FCW系統(tǒng)的前方車輛候選框提取方法
- 目標(biāo)檢測(cè)方法及裝置
- 一種針對(duì)目標(biāo)檢測(cè)的數(shù)據(jù)輔助標(biāo)注方法、裝置及系統(tǒng)
- 一種基于SSD目標(biāo)檢測(cè)的優(yōu)化方法、計(jì)算機(jī)設(shè)備和介質(zhì)
- 一種圖像處理方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 候選框標(biāo)注方法及系統(tǒng)及模型訓(xùn)練方法及目標(biāo)檢測(cè)方法
- 一種基于候選框特征修正的遙感圖像目標(biāo)檢測(cè)方法及系統(tǒng)
- 感興趣區(qū)域確定方法、圖像內(nèi)容識(shí)別方法及裝置
- 構(gòu)建墊、實(shí)體圖像構(gòu)建物和構(gòu)建構(gòu)建物支撐件的方法
- 支持松耦合的軟件構(gòu)建方法、系統(tǒng)及該系統(tǒng)的實(shí)現(xiàn)方法
- 版本的構(gòu)建系統(tǒng)及方法
- 工程構(gòu)建系統(tǒng)及其構(gòu)建方法
- 實(shí)例構(gòu)建方法、裝置及軟件系統(tǒng)
- 軟件構(gòu)建方法、軟件構(gòu)建裝置和軟件構(gòu)建系統(tǒng)
- 天花板地圖構(gòu)建方法、構(gòu)建裝置以及構(gòu)建程序
- 一種項(xiàng)目構(gòu)建方法、持續(xù)集成系統(tǒng)及終端設(shè)備
- 并行構(gòu)建的方法、裝置及設(shè)備
- 構(gòu)建肺癌預(yù)測(cè)模型構(gòu)建方法





