[發(fā)明專利]一種基于SSD算法的管道周邊機械設(shè)備識別方法在審
| 申請?zhí)枺?/td> | 202210522875.2 | 申請日: | 2022-05-13 |
| 公開(公告)號: | CN114863281A | 公開(公告)日: | 2022-08-05 |
| 發(fā)明(設(shè)計)人: | 李洪烈;李智文;嚴密;顧清林;馮偉;程艷;鄭大海;毛建;李德明;劉會斌;沈飛軍;舒亮 | 申請(專利權(quán))人: | 國家石油天然氣管網(wǎng)集團有限公司 |
| 主分類號: | G06V20/10 | 分類號: | G06V20/10;G06V10/32;G06V10/44;G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 蘇州科權(quán)知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 32561 | 代理人: | 楊文龍 |
| 地址: | 100013 北京市朝*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 ssd 算法 管道 周邊 機械設(shè)備 識別 方法 | ||
1.一種基于SSD算法的管道周邊機械設(shè)備識別方法,其特征在于:其步驟如下:
S1:將工地上獲得的原始工程機械的圖片進行清洗,并根據(jù)它對應(yīng)的機械類別進行分類;
S2:對數(shù)據(jù)集中的圖片統(tǒng)一縮放到800*800規(guī)格,并對縮放后的圖片進行標注,獲得標注后的.xml標注文件;
S3:通過網(wǎng)絡(luò)獲取不含有工程機械的背景圖片,并生成對應(yīng)的.xml文件,加入數(shù)據(jù)集;
S4:使用多張數(shù)據(jù)集內(nèi)部圖片拼湊成單張包含工程機械的圖片,并生成對應(yīng)的.xml文件加入數(shù)據(jù)集;
S5:將數(shù)據(jù)集劃分為訓(xùn)練集測試集和驗證集,劃分比例為9:1:1,并對訓(xùn)練集中的數(shù)據(jù)進行數(shù)據(jù)增強;
S6:搭建目標檢測的骨干網(wǎng)絡(luò),采用的SSD骨干網(wǎng)絡(luò)為MobileNet,MoblieNet由普通的卷積層、批標準化層和深度可分離卷積組成,其中深度可分離卷積層采用將單個濾波器應(yīng)用于每個輸入通道,然后逐點卷積應(yīng)用1×1卷積以組合輸出深度卷積的方式減小了普通卷積層的參數(shù),該網(wǎng)絡(luò)的每個卷積層后面都跟有批標準化層和Relu激活函數(shù);
S7:搭建基于SSD算法的神經(jīng)網(wǎng)絡(luò)模型,使用SSD算法的模型結(jié)構(gòu),對MobileNet提取的特征層從6個不同尺度進行深層次的特征提取,并從6個不同尺度信息中檢測目標的位置,這樣可以更好的預(yù)測目標的位置及分類,最后使用非極大值抑制算法對重復(fù)的結(jié)果進行過濾,得到最終的檢測結(jié)果;
S8:使用反向傳播算法對神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練,在訓(xùn)練過程中進行驗證,當(dāng)訓(xùn)練損失和驗證損失最低時保存網(wǎng)絡(luò)訓(xùn)練的最優(yōu)模型;
S9:使用保存的最優(yōu)模型對測試集進行測試,就可以得到工程機械圖片的檢測結(jié)果。
2.根據(jù)權(quán)利要求1所述的一種基于SSD算法的管道周邊機械設(shè)備識別方法,其特征在于:所述S1中的原始工程機械類別分為:挖掘機械、鏟運機械、鑿巖機械、壓實機械和樁工機械五類。
3.根據(jù)權(quán)利要求1所述的一種基于SSD算法的管道周邊機械設(shè)備識別方法,其特征在于:所述S5中數(shù)據(jù)增強方法有圖像鏡像、高斯模糊、隨機旋轉(zhuǎn)和隨機去掉一些像素點。
4.根據(jù)權(quán)利要求1所述的一種基于SSD算法的管道周邊機械設(shè)備識別方法,其特征在于:所述S7中模型總體骨干結(jié)構(gòu)如下所示:
第一卷積層,卷積核大小為3*3,總共32個濾波器,步幅stride=2;
第一深度可分離卷積層,卷積核大小為3*3,輸出特征圖為64個通道;
第二深度可分離卷積層,卷積核大小為3*3,輸出特征圖為128個通道;
第三深度可分離卷積層,卷積核大小為3*3,輸出特征圖為128個通道;
第四深度可分離卷積層,卷積核大小為3*3,輸出特征圖為256個通道;
第五深度可分離卷積層,卷積核大小為3*3,輸出特征圖為256個通道;
第六深度可分離卷積層,卷積核大小為3*3,輸出特征圖為512個通道;
第七深度可分離卷積層,卷積核大小為3*3,輸出特征圖為512個通道;
第八深度可分離卷積層,卷積核大小為3*3,輸出特征圖為512個通道;
第九深度可分離卷積層,卷積核大小為3*3,輸出特征圖為512個通道;
第十深度可分離卷積層,卷積核大小為3*3,輸出特征圖為512個通道;
第十一深度可分離卷積層,卷積核大小為3*3,輸出特征圖為512個通道;
第十二深度可分離卷積層,卷積核大小為3*3,輸出特征圖為1024個通道;
第十三深度可分離卷積層,卷積核大小為3*3,輸出特征圖為1024個通道;
第二卷積層,卷積核大小為1*1,輸出特征圖為256個通道;
第三卷積層,卷積核大小為3*3,輸出特征圖為512個通道;
第四卷積層,卷積核大小為1*1,輸出特征圖為128個通道;
第五卷積層,卷積核大小為3*3,輸出特征圖為256個通道;
第六卷積層,卷積核大小為1*1,輸出特征圖為128個通道;
第七卷積層,卷積核大小為3*3,輸出特征圖為256個通道;
第八卷積層,卷積核大小為1*1,輸出特征圖為64個通道;
第九卷積層,卷積核大小為3*3,輸出特征圖為128個通道。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于國家石油天然氣管網(wǎng)集團有限公司,未經(jīng)國家石油天然氣管網(wǎng)集團有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210522875.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





