[發(fā)明專利]基于深度學(xué)習(xí)的定位方法和系統(tǒng)在審
| 申請?zhí)枺?/td> | 201910140228.3 | 申請日: | 2019-02-26 |
| 公開(公告)號: | CN109977945A | 公開(公告)日: | 2019-07-05 |
| 發(fā)明(設(shè)計)人: | 孟健;紀(jì)國強(qiáng);戴維倫;湯興粲;劉勝波;王會玲 | 申請(專利權(quán))人: | 博眾精工科技股份有限公司 |
| 主分類號: | G06K9/32 | 分類號: | G06K9/32;G06N3/04;G06N3/08 |
| 代理公司: | 蘇州創(chuàng)元專利商標(biāo)事務(wù)所有限公司 32103 | 代理人: | 范晴;丁浩秋 |
| 地址: | 215000 江蘇省蘇州*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 卷積神經(jīng)網(wǎng)絡(luò) 候選框 篩選 構(gòu)建 錨框 抓取 機(jī)械手 定點坐標(biāo) 候選區(qū)域 候選網(wǎng)絡(luò) 角度信息 旋轉(zhuǎn)定位 最優(yōu)模型 偏移量 旋轉(zhuǎn)框 映射 學(xué)習(xí) 標(biāo)注 標(biāo)簽 采集 圖像 輸出 分類 預(yù)測 | ||
本發(fā)明公開了一種基于深度學(xué)習(xí)的定位方法,包括:構(gòu)建基礎(chǔ)卷積神經(jīng)網(wǎng)絡(luò),通過基礎(chǔ)卷積神經(jīng)網(wǎng)絡(luò)提取采集的圖像的深度學(xué)習(xí)特征;構(gòu)建區(qū)域候選網(wǎng)絡(luò),篩選初步候選錨框確定前景和背景標(biāo)簽,計算標(biāo)注數(shù)據(jù)與篩選后的錨框之間的偏移量;根據(jù)基礎(chǔ)卷積神經(jīng)網(wǎng)絡(luò)輸出的特征映射生成旋轉(zhuǎn)矩形局域候選框,所述旋轉(zhuǎn)矩形局域候選框使用兩個定點坐標(biāo)和高度表示;根據(jù)旋轉(zhuǎn)矩形局域候選框的旋轉(zhuǎn)矩形的交并比篩選候選區(qū)域,計算分類損失、預(yù)測旋轉(zhuǎn)框的坐標(biāo)和角度損失,得到最優(yōu)模型參數(shù)進(jìn)行定位。可以識別目標(biāo)的角度信息,旋轉(zhuǎn)定位框,有助于機(jī)械手更加精準(zhǔn)的抓取目標(biāo)。
技術(shù)領(lǐng)域
本發(fā)明涉及一種基于深度學(xué)習(xí)的定位方法,具體地涉及一種基于深度學(xué)習(xí)的旋轉(zhuǎn)定位框進(jìn)行定位的方法的系統(tǒng)。
背景技術(shù)
隨著工業(yè)自動化技術(shù)的發(fā)展,機(jī)器人的數(shù)量在不斷的增加,工業(yè)機(jī)器人已經(jīng)廣泛的應(yīng)用到汽車制造,機(jī)械加工、電子電氣以及智能家庭服務(wù)等生活的方方面面。機(jī)器人技術(shù)的發(fā)展在一定程度上反應(yīng)了一個國家自動化的發(fā)展水平,隨著社會經(jīng)濟(jì)的發(fā)展,生產(chǎn)規(guī)模的擴(kuò)大以及生產(chǎn)環(huán)境的復(fù)雜化,開發(fā)和生產(chǎn)更加智能化、信息化、高精度的自動化系統(tǒng)顯得尤為的重要。在機(jī)器視覺領(lǐng)域,目標(biāo)識別與定位是關(guān)鍵技術(shù),其不僅可以指引機(jī)器人完成某項任務(wù),如工業(yè)零件加工、分揀以及搬運等任務(wù)。其在視覺場景理解、地圖創(chuàng)建以及AR等復(fù)雜的視覺領(lǐng)域也有重要的意義,研究機(jī)器視覺技術(shù)是推動機(jī)器人發(fā)展的一項巨大的舉措。
傳統(tǒng)的機(jī)械臂的抓取采用的是示教系統(tǒng),但當(dāng)待抓取目標(biāo)的位置、形狀以及環(huán)境發(fā)生變化時,示教系統(tǒng)下的機(jī)械臂不能隨外界的變化而做出相應(yīng)的調(diào)整,因而會造成抓取任務(wù)的失敗。計算機(jī)視覺解決機(jī)械臂抓取任務(wù)的通常做法是,首先利用相機(jī)對場景采樣,利用圖像處理算法獲取目標(biāo)位置以及空間的姿態(tài)信息,最終使機(jī)械臂完成抓取任務(wù)。傳統(tǒng)的機(jī)械臂識別階段的圖像處理采用特征提取的方法來處理圖像信息,特征提取的過程中容易受到光照、目標(biāo)形狀和目標(biāo)大小等外界因素的影響,因此泛化能力和魯棒性較差。深度學(xué)習(xí)概念是Hinton在2006年首次提出,Krizhevsky在2012年的ImageNet比賽利用深度學(xué)習(xí)的方法取得了優(yōu)異的成績,深度學(xué)習(xí)引起了全世界研究人員的關(guān)注。相比于傳統(tǒng)的視覺算法,深度學(xué)習(xí)不需要使用者預(yù)先選定提取的何種特征,而是通過學(xué)習(xí)的方式在大量的數(shù)據(jù)中找到目標(biāo)所具有的特征。
但是,目前深度學(xué)習(xí)定位算法只是單純的垂直框的定位,如圖1所示,在實際工程應(yīng)用中,有些目標(biāo)會有一定的傾斜,使得垂直定位框無法精確的定位目標(biāo)。
發(fā)明內(nèi)容
針對上述存在的技術(shù)問題,本發(fā)明目的是:提供了一種基于深度學(xué)習(xí)的定位方法和系統(tǒng),可以識別目標(biāo)的角度信息,旋轉(zhuǎn)定位框,有助于機(jī)械手更加精準(zhǔn)的抓取目標(biāo)。
本發(fā)明的技術(shù)方案是:
一種基于深度學(xué)習(xí)的定位方法,包括以下步驟:
S01:構(gòu)建基礎(chǔ)卷積神經(jīng)網(wǎng)絡(luò),通過基礎(chǔ)卷積神經(jīng)網(wǎng)絡(luò)提取采集的圖像的深度學(xué)習(xí)特征;
S02:構(gòu)建區(qū)域候選網(wǎng)絡(luò),篩選初步候選錨框確定前景和背景標(biāo)簽,計算標(biāo)注數(shù)據(jù)與篩選后的錨框之間的偏移量;
S03:根據(jù)基礎(chǔ)卷積神經(jīng)網(wǎng)絡(luò)輸出的特征映射生成旋轉(zhuǎn)矩形局域候選框,所述旋轉(zhuǎn)矩形局域候選框使用兩個定點坐標(biāo)和高度表示;
S04:根據(jù)旋轉(zhuǎn)矩形局域候選框的旋轉(zhuǎn)矩形的交并比篩選候選區(qū)域,計算分類損失、預(yù)測旋轉(zhuǎn)框的坐標(biāo)和角度損失,得到最優(yōu)模型參數(shù)進(jìn)行定位。
優(yōu)選的技術(shù)方案中,所述步驟S02包括:
S21:根據(jù)基礎(chǔ)卷積神經(jīng)網(wǎng)絡(luò)輸出的特征映射生成初步候選錨框,得到圖像每個位置所需候選錨框數(shù)目為:
num_anchor=n*m*ration*scaler
其中,n、m、ration、scaler分別表示輸出特征映射的長、寬、生成錨框的不同長寬比、生成錨框的不同尺度;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于博眾精工科技股份有限公司,未經(jīng)博眾精工科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910140228.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 終端卷積神經(jīng)網(wǎng)絡(luò)的處理方法、裝置、存儲介質(zhì)及處理器
- 一種基于卷積神經(jīng)網(wǎng)絡(luò)的圖像深度估計方法
- 卷積神經(jīng)網(wǎng)絡(luò)的生成方法及裝置
- 一種卷積神經(jīng)網(wǎng)絡(luò)硬件模塊部署方法
- 卷積神經(jīng)網(wǎng)絡(luò)的處理方法、裝置、設(shè)備及存儲介質(zhì)
- 一種卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法及裝置
- 一種基于通道數(shù)搜索卷積神經(jīng)網(wǎng)絡(luò)的方法
- 卷積神經(jīng)網(wǎng)絡(luò)處理方法、裝置和電子系統(tǒng)
- 一種基于空洞卷積循環(huán)神經(jīng)網(wǎng)絡(luò)的聲音事件檢測方法
- 基于稀疏卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測方法及檢測裝置
- 一種自適應(yīng)非極大抑制的目標(biāo)檢測方法
- 一種緊湊雙車牌檢測方法及裝置
- 基于FCW系統(tǒng)的前方車輛候選框提取方法
- 目標(biāo)檢測方法及裝置
- 一種針對目標(biāo)檢測的數(shù)據(jù)輔助標(biāo)注方法、裝置及系統(tǒng)
- 一種基于SSD目標(biāo)檢測的優(yōu)化方法、計算機(jī)設(shè)備和介質(zhì)
- 一種圖像處理方法、裝置、電子設(shè)備和存儲介質(zhì)
- 候選框標(biāo)注方法及系統(tǒng)及模型訓(xùn)練方法及目標(biāo)檢測方法
- 一種基于候選框特征修正的遙感圖像目標(biāo)檢測方法及系統(tǒng)
- 感興趣區(qū)域確定方法、圖像內(nèi)容識別方法及裝置
- 構(gòu)建墊、實體圖像構(gòu)建物和構(gòu)建構(gòu)建物支撐件的方法
- 支持松耦合的軟件構(gòu)建方法、系統(tǒng)及該系統(tǒng)的實現(xiàn)方法
- 版本的構(gòu)建系統(tǒng)及方法
- 工程構(gòu)建系統(tǒng)及其構(gòu)建方法
- 實例構(gòu)建方法、裝置及軟件系統(tǒng)
- 軟件構(gòu)建方法、軟件構(gòu)建裝置和軟件構(gòu)建系統(tǒng)
- 天花板地圖構(gòu)建方法、構(gòu)建裝置以及構(gòu)建程序
- 一種項目構(gòu)建方法、持續(xù)集成系統(tǒng)及終端設(shè)備
- 并行構(gòu)建的方法、裝置及設(shè)備
- 構(gòu)建肺癌預(yù)測模型構(gòu)建方法





