[發明專利]一種面向道路場景的快速語義分割方法在審
| 申請號: | 201911256375.3 | 申請日: | 2019-12-10 |
| 公開(公告)號: | CN111179272A | 公開(公告)日: | 2020-05-19 |
| 發明(設計)人: | 歐勇盛;彭遠哲;王志揚;熊榮 | 申請(專利權)人: | 中國科學院深圳先進技術研究院 |
| 主分類號: | G06T7/10 | 分類號: | G06T7/10;G06N3/04 |
| 代理公司: | 北京市誠輝律師事務所 11430 | 代理人: | 范盈 |
| 地址: | 518055 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 面向 道路 場景 快速 語義 分割 方法 | ||
1.一種面向道路場景的快速語義分割方法,其特征在于:具體包括如下步驟:
步驟1,基于卷積神經網絡構建模型;
步驟2,利用訓練數據對步驟1構建的模型進行訓練;
步驟3,利用損失函數計算經步驟2訓練后的模型損失,并根據所得模型損失結果計算梯度;
步驟4,根據步驟3所得梯度對模型參數進行更新。
2.根據權利要求1所述的一種面向道路場景的快速語義分割方法,其特征在于:所述步驟1的具體過程為:使用若干個卷積核構成一個卷積神經網絡對輸入圖像進行處理,從而實現輸入3×H×W的數據得到1×H×W的預測輸出,其中H為輸入圖像高度,W為輸入圖像寬度;
根據如下公式(1)構建模型:
其中,Fout為輸出特征,Fin為輸入特征,Ki為第i個卷積核,N為輸出通道數,b為偏置;
由于圖像是二維數據,所以輸入特征的大小為Cin×Hin×Win,使用的卷積核大小為Cout×Cin×Hk×Wk,得到的輸出特征為Cout×Hout×Wout;
其中,Cin和Cout為輸入和輸出特征的通道數,Hin和Win為輸入特征的高和寬,Hk和Wk為卷積核的高和寬,Hout和Wout為輸出特征的高和寬;
對于輸入為Cin×Hin×Win的特征,使用Cout個大小為Cin×Hk×Wk的卷積核在輸入特征上進行滑動乘加操作,便得到了Cout個大小為Hout×Wout的特征。
3.根據權利要求2所述的一種面向道路場景的快速語義分割方法,其特征在于:所述步驟1中輸出特征的高和寬的計算過程如下:
其中,p為邊框寬度,s為步長。
4.根據權利要求3所述的一種面向道路場景的快速語義分割方法,其特征在于:所述步驟2的具體過程為:所述訓練數據包括人為采集的圖像以及與采集圖像對應的標簽圖像;
訓練的過程即為:由輸入圖像得到標簽圖像,輸入圖像為彩色RGB圖像,標簽圖像為單通道的灰度圖像。
5.根據權利要求4所述的一種面向道路場景的快速語義分割方法,其特征在于:所述步驟2中,由于圖像像素的灰度值直接代表了該像素屬于的類別;當圖像有C個類需要分割時,則標簽圖像中的每個像素值為0~C-1。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院深圳先進技術研究院,未經中國科學院深圳先進技術研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911256375.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種工業型監控光交換機
- 下一篇:一種提升鈦合金薄壁件銑削穩定域的方法





