[發(fā)明專利]一種基于多監(jiān)督網(wǎng)絡(luò)的道路場景圖像語義分割方法在審
| 申請?zhí)枺?/td> | 202110823118.4 | 申請日: | 2021-07-21 |
| 公開(公告)號: | CN113362349A | 公開(公告)日: | 2021-09-07 |
| 發(fā)明(設(shè)計)人: | 周武杰;董少華;強芳芳;許彩娥 | 申請(專利權(quán))人: | 浙江科技學院 |
| 主分類號: | G06T7/11 | 分類號: | G06T7/11;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 杭州求是專利事務所有限公司 33200 | 代理人: | 林超 |
| 地址: | 310023 浙*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 監(jiān)督 網(wǎng)絡(luò) 道路 場景 圖像 語義 分割 方法 | ||
1.一種基于多監(jiān)督網(wǎng)絡(luò)的道路場景圖像語義分割方法,其特征在于,包括訓練階段和測試階段兩個過程;
所述的訓練階段過程的具體步驟為:
步驟1_1:選取多幅原始道路場景RGB圖像和對應的原始Thermal熱紅外圖像以及真實語義分割圖像,將每幅原始道路場景RGB圖像和原始Thermal熱紅外圖像分別通過裁剪、明亮度、翻轉(zhuǎn)方式進行數(shù)據(jù)增強之后獲得初始道路場景RGB圖像和初始Thermal熱紅外圖像,由多幅初始道路場景RGB圖像和初始Thermal熱紅外圖像以及對應的真實語義分割圖像構(gòu)成訓練集;
步驟1_2:構(gòu)建卷積神經(jīng)網(wǎng)絡(luò);
步驟1_3:將訓練集輸入到卷積神經(jīng)網(wǎng)絡(luò)中進行訓練,卷積神經(jīng)網(wǎng)絡(luò)輸出訓練集中的每幅原始道路場景RGB圖像對應的七個預測圖集合;
步驟1_4:將每幅原始道路場景RGB圖像對應的真實語義分割圖像處理成9幅獨熱編碼圖像并將9幅獨熱編碼圖像的集合記為Jtrue,分別計算9幅獨熱編碼圖像的集合Jtrue與對應的七個預測圖集合之間的損失函數(shù)值,將七個損失函數(shù)值之和作為最終損失值;
步驟1_5:重復執(zhí)行步驟1_3和步驟1_4共V次,直到卷積神經(jīng)網(wǎng)絡(luò)收斂達到飽和,獲得卷積神經(jīng)網(wǎng)絡(luò)分類訓練模型;將此時得到的網(wǎng)絡(luò)的權(quán)值矢量和偏置作為卷積神經(jīng)網(wǎng)絡(luò)分類訓練模型的最優(yōu)權(quán)值矢量和最優(yōu)偏置項;
所述的測試階段過程的具體步驟為:
步驟2:將多幅待語義分割的原始道路場景RGB圖像和原始Thermal熱紅外圖像輸入卷積神經(jīng)網(wǎng)絡(luò)分類訓練模型中,利用最優(yōu)權(quán)值矢量和最優(yōu)偏置項進行預測,獲得對應的語義分割預測圖。
2.根據(jù)權(quán)利要求1所述的一種基于多監(jiān)督網(wǎng)絡(luò)的道路場景圖像語義分割方法,其特征在于:所述卷積神經(jīng)網(wǎng)絡(luò)包括編碼模塊和解碼模塊兩部分,編碼模塊與解碼模塊相連;
編碼模塊包括10個編碼模塊,解碼模塊包括語義AHLS模塊、多任務監(jiān)督RM模塊、5個信息融合FM模塊、5個特征融合AMMF模塊和3個語義監(jiān)督MLF模塊;
第一編碼模塊依次經(jīng)第二編碼模塊、第三編碼模塊、第四編碼模塊和第五編碼模塊后與語義AHLS模塊相連,第六編碼模塊依次經(jīng)第七編碼模塊、第八編碼模塊、第九編碼模塊和第十編碼模塊后與語義AHLS模塊相連,第一編碼模塊的輸入為初始道路場景RGB圖像,第六編碼模塊的輸入為初始Thermal熱紅外圖像;
第五編碼模塊、語義AHLS模塊和第十編碼模塊與第一特征融合AMMF模塊相連,第一特征融合AMMF模塊的輸出與語義AHLS模塊的輸出分別輸入到第一信息融合FM模塊的第一輸入和第二輸入中,第一信息融合FM模塊的輸出和語義AHLS模塊的輸出同時輸入到第一語義監(jiān)督MLF模塊,第一語義監(jiān)督MLF模塊的輸出作為卷積神經(jīng)網(wǎng)絡(luò)的第二輸出;
第四編碼模塊的輸出、第一信息融合FM模塊的輸出和第九編碼模塊的輸出輸入到第二特征融合AMMF模塊,第二特征融合AMMF模塊的輸出與語義AHLS模塊的輸出分別輸入到第二信息融合FM模塊的第一輸入和第二輸入中,第二信息融合FM模塊的輸出、第三編碼模塊的輸出和第八編碼模塊的輸出同時輸入到第三特征融合AMMF模塊,第三特征融合AMMF模塊的輸出與語義AHLS模塊的輸出分別輸入到第三信息融合FM模塊的第一輸入和第二輸入中,第二信息融合FM模塊的輸出和第三信息融合FM模塊的輸出同時輸入到第二語義監(jiān)督MLF模塊,第二語義監(jiān)督MLF模塊的輸出作為卷積神經(jīng)網(wǎng)絡(luò)的第三輸出;
第二編碼模塊的輸出、第三信息融合FM模塊的輸出和第七編碼模塊的輸出輸入到第四特征融合AMMF模塊,第四特征融合AMMF模塊的輸出與語義AHLS模塊的輸出分別輸入到第四信息融合FM模塊的第一輸入和第二輸入中,第四信息融合FM模塊的輸出、第一編碼模塊的輸出和第六編碼模塊的輸出輸入到第五特征融合AMMF模塊,第五特征融合AMMF模塊的輸出與語義AHLS模塊的輸出分別輸入到第五信息融合FM模塊的第一輸入和第二輸入中,第四信息融合FM模塊的輸出和第五信息融合FM模塊的輸出同時輸入到第三語義監(jiān)督MLF模塊,第三語義監(jiān)督MLF模塊的輸出作為卷積神經(jīng)網(wǎng)絡(luò)的第四輸出;第五信息融合FM模塊的輸出作為卷積神經(jīng)網(wǎng)絡(luò)的第一輸出,第五信息融合FM模塊的輸出輸入到多任務監(jiān)督RM模塊,多任務監(jiān)督RM模塊的第一輸出、第二輸出和第三輸出分別作為卷積神經(jīng)網(wǎng)絡(luò)的第五輸出、第六輸出和第七輸出。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江科技學院,未經(jīng)浙江科技學院許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110823118.4/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種夾苗裝置及夾苗方法
- 下一篇:一種移位助行減重裝置
- 在即時通信中提供即時監(jiān)督功能的方法及系統(tǒng)
- 一種監(jiān)督事件的生成裝置
- 一種資產(chǎn)托管監(jiān)督任務的處理方法及裝置
- 一種監(jiān)督方法及裝置
- 基于自監(jiān)督學習的標簽比例學習模型的訓練方法和設(shè)備
- 一種衛(wèi)生監(jiān)督對象尋址方法、電子設(shè)備及存儲介質(zhì)
- 一種機器人表情調(diào)用方法和家用機器人
- 計算機視覺訓練系統(tǒng)和用于訓練計算機視覺系統(tǒng)的方法
- 一種基于廠區(qū)智能管理系統(tǒng)的工廠設(shè)備監(jiān)督系統(tǒng)
- 信息化綜合監(jiān)督系統(tǒng)及方法
- 網(wǎng)絡(luò)和網(wǎng)絡(luò)終端
- 網(wǎng)絡(luò)DNA
- 網(wǎng)絡(luò)地址自適應系統(tǒng)和方法及應用系統(tǒng)和方法
- 網(wǎng)絡(luò)系統(tǒng)及網(wǎng)絡(luò)至網(wǎng)絡(luò)橋接器
- 一種電力線網(wǎng)絡(luò)中根節(jié)點網(wǎng)絡(luò)協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡(luò)定位方法、存儲介質(zhì)及移動終端
- 網(wǎng)絡(luò)裝置、網(wǎng)絡(luò)系統(tǒng)、網(wǎng)絡(luò)方法以及網(wǎng)絡(luò)程序
- 從重復網(wǎng)絡(luò)地址自動恢復的方法、網(wǎng)絡(luò)設(shè)備及其存儲介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的訓練方法、裝置及存儲介質(zhì)
- 網(wǎng)絡(luò)管理方法和裝置
- 一種道路數(shù)據(jù)存儲方法及設(shè)備
- 密路網(wǎng)小街區(qū)的居住社區(qū)機非分離道路地庫復合系統(tǒng)
- 一種道路壓蓋關(guān)系的確定方法及裝置
- 城市道路主輔式設(shè)置
- 城市道路主輔十字交錯式設(shè)置
- 一種道路描繪方法、裝置及計算機存儲介質(zhì)
- 一種道路生成方法、裝置、計算機設(shè)備及存儲介質(zhì)
- 道路采集任務的生成、裝置、電子設(shè)備及可讀存儲介質(zhì)
- 一種路徑生成方法、裝置、終端設(shè)備及存儲介質(zhì)
- 農(nóng)村道路類型識別方法、系統(tǒng)、終端設(shè)備及可讀存儲介質(zhì)





