[發(fā)明專利]一種焊點識別方法在審
| 申請?zhí)枺?/td> | 201911410782.5 | 申請日: | 2019-12-31 |
| 公開(公告)號: | CN111160479A | 公開(公告)日: | 2020-05-15 |
| 發(fā)明(設(shè)計)人: | 游文婧;張浪文;陳立定 | 申請(專利權(quán))人: | 華南理工大學(xué) |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 廣州市華學(xué)知識產(chǎn)權(quán)代理有限公司 44245 | 代理人: | 仵樂娟 |
| 地址: | 510640 廣*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 識別 方法 | ||
本發(fā)明涉及一種焊點識別方法,該方法包括基于Faster?R?CNN模型,對汽車門板圖像上的焊點進行識別;其中根據(jù)樣本圖像訓(xùn)練Faster?R?CNN模型,樣本圖像是標(biāo)定的汽車焊點圖像;Faster?R?CNN模型包括VGG16網(wǎng)絡(luò)、RPN網(wǎng)絡(luò)以及Fast?RCNN網(wǎng)絡(luò),RPN網(wǎng)絡(luò)的輸出值接入Fast?RCNN網(wǎng)絡(luò)之前,按照分類概率值的大小對RPN網(wǎng)絡(luò)輸出的建議區(qū)域進行排序,挑選與檢測目標(biāo)匹配度最優(yōu)的特定建議區(qū)域輸入Fast?RCNN網(wǎng)絡(luò),F(xiàn)ast?RCNN網(wǎng)絡(luò)輸出焊點的定位及分類。該Faster?R?CNN模型應(yīng)用于汽車門板焊點的識別,改進了小目標(biāo)檢測上的缺陷,提高了檢測的精度與效率。
技術(shù)領(lǐng)域
本發(fā)明涉及圖像處理領(lǐng)域,具體涉及一種焊點識別方法。
背景技術(shù)
現(xiàn)有的目標(biāo)檢測所采用的R-CNN(Region-CNN)使用Selective Search生成候選區(qū)域,CNN網(wǎng)絡(luò)提取圖像特征,特征分別送入多個線性支持向量機(SVM)二類分類器進行判別,線性脊回歸器進行候選框的位置精修。其缺點是各候選區(qū)域重復(fù)提取特征導(dǎo)致檢測速度很慢。為了解決R-CNN算法多個候選區(qū)域重復(fù)計算的問題,F(xiàn)ast-R-CNN加入了建議區(qū)域池化層將不同大小的建議區(qū)域?qū)?yīng)的特征轉(zhuǎn)為固定大小的區(qū)域特征,再分別傳入兩個全連接層輸出,傳入傳統(tǒng)softmax層進行分類,傳入回歸器回歸候選框,大幅減少了計算開銷,避免重復(fù)卷積,計算效率進一步提升。但是建議區(qū)域的生成速度慢、效率低很大程度地影響識別速度的進一步提升。為了解決上述問題,F(xiàn)aster-R-CNN出現(xiàn)了,但是當(dāng)前的Faster-R-CN模型在檢測小目標(biāo)時存在檢測精度與檢測效率低的問題。
發(fā)明內(nèi)容
針對現(xiàn)有技術(shù)中存在的技術(shù)問題,本發(fā)明的首要目的是提供一種焊點的識別方法。基于該目的,本發(fā)明至少提供如下技術(shù)方案:
一種焊點識別方法,所述方法包括:
基于Faster-R-CNN模型,對焊點進行識別;其中,
根據(jù)樣本圖像訓(xùn)練Faster-R-CNN模型,所述樣本圖像是標(biāo)定的汽車門板焊點圖像;所述Faster-R-CNN模型包括VGG16網(wǎng)絡(luò)、RPN網(wǎng)絡(luò)以及Fast-RCNN網(wǎng)絡(luò),所述RPN網(wǎng)絡(luò)的輸出值接入所述Fast-RCNN網(wǎng)絡(luò)之前,按照分類概率值的大小對所述RPN網(wǎng)絡(luò)輸出的建議區(qū)域進行排序,挑選與檢測目標(biāo)匹配度最優(yōu)的特定建議區(qū)域輸入Fast-RCNN網(wǎng)絡(luò),所述Fast-RCNN網(wǎng)絡(luò)輸出所述焊點的定位及分類。
進一步的,所述VGG16網(wǎng)絡(luò)包含13個卷積層、13個LeakyRelu激活層以及4個池化層。
進一步的,F(xiàn)ast-RCNN網(wǎng)絡(luò)包括建議區(qū)域池化層以及兩個并列的全連接層,其中建議區(qū)域池化層采用最大池化層。
進一步的,所述建議區(qū)域包含兩種像素尺度以及三種縮放比,所述兩種像素尺度為2.828*2.828以及8*8,所述三種縮放比為0.25、0.5以及1。
進一步的,所述LeakyRelu激活層使用的激活函數(shù)為:f(x)=max(0.01x,x),其中x為上層卷積的輸出。
進一步的,所述特定建議區(qū)域采用非極大值抑制方法挑選,所述非極大值抑制方法包括如下步驟:
S1.1、將所有建議區(qū)域按照分類概率值的大小排序,選中最高分類概率值及其對應(yīng)的建議區(qū)域;
S1.2、遍歷其余的建議區(qū)域,比較當(dāng)前建議區(qū)域和當(dāng)前最高分的建議區(qū)域的面積,如果當(dāng)前建議區(qū)域和當(dāng)前最高分的建議區(qū)域的重疊面積大于一定閾值,則刪除該當(dāng)前建議區(qū)域;
S1.3、從未比較的建議區(qū)域中選擇最高分類概率值的建議區(qū)域,重復(fù)步驟S1.1-1.2,直到所有建議區(qū)域被選擇。
進一步的,所述閾值為0.3。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華南理工大學(xué),未經(jīng)華南理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911410782.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





