[發明專利]一種用于交通道路場景的圖像語義分割模型訓練方法在審
| 申請號: | 202210103540.7 | 申請日: | 2022-01-28 |
| 公開(公告)號: | CN114419058A | 公開(公告)日: | 2022-04-29 |
| 發明(設計)人: | 張帆;曹松;任必為;宋君;陶海 | 申請(專利權)人: | 北京文安智能技術股份有限公司 |
| 主分類號: | G06T7/10 | 分類號: | G06T7/10;G06N3/04;G06N3/08;G06T5/50 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100094 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用于 交通 道路 場景 圖像 語義 分割 模型 訓練 方法 | ||
1.一種用于交通道路場景的圖像語義分割模型訓練方法,其特征在于,包括:
步驟S1,構造基礎網絡為DeepLabV3plus網絡和ResnetX網絡組合的語義分割基礎模型,其中,所述DeepLabV3plus網絡的上采樣算子使用最鄰近插值模式計算;
步驟S2,調整所述基礎網絡的結構以形成語義分割初始模型,其中,調整過程為:復制所述DeepLabV3plus網絡的卷積模塊至所述DeepLabV3plus網絡的底部作為底層卷積模塊,將所述基礎網絡的輸入端通過卷積層組后通過跳躍連接的方式與所述DeepLabV3plus網絡的輸出端合并,將合并端作為所述底層卷積模塊的輸入端,所述底層卷積模塊的輸出為最終語義分割結果;
步驟S3,利用交通道路場景的樣本圖像訓練集訓練所述語義分割初始模型,以獲得圖像語義分割模型。
2.根據權利要求1所述的圖像語義分割模型訓練方法,其特征在于,所述卷積層組包括一層或多層所述卷積層,各所述卷積層的卷積核尺寸為3×3,卷積步長為1,填充值為0或1。
3.根據權利要求2所述的圖像語義分割模型訓練方法,其特征在于,所述卷積層組包括多層所述卷積層,多層卷積層的數量大于1層且小于等于3層。
4.根據權利要求2所述的圖像語義分割模型訓練方法,其特征在于, 所述填充值包括填充寬度值和填充高度值。
5.根據權利要求1所述的圖像語義分割模型訓練方法,其特征在于,所述DeepLabV3plus網絡的卷積模塊和所述底層卷積模塊的結構自上而下包括:卷積層、BN層、Relu層和卷積層。
6.根據權利要求1所述的圖像語義分割模型訓練方法,其特征在于,所述樣本圖像訓練集包括第一訓練集和第二訓練集,所述第一訓練集中的訓練圖像選自奧迪大型自動駕駛數據集A2D2中的前部車載取像設備沿道路方向的拍攝的正視交通道路場景圖像和后部車載取像設備沿道路方向的拍攝的正視交通道路場景圖像;所述第二訓練集中的訓練圖像為高速道路場景圖像。
7.根據權利要求6所述的圖像語義分割模型訓練方法,其特征在于,所述步驟S3包括:
步驟S31,使用所述第一訓練集預訓練所述語義分割初始模型,以獲得語義分割預訓練模型;
步驟S32,調整模型訓練的學習率,使用所述第二訓練集繼續訓練所述語義分割預訓練模型,以獲得所述圖像語義分割模型。
8.根據權利要求7所述的圖像語義分割模型訓練方法,其特征在于,在所述步驟S32中,調整訓練所述語義分割預訓練模型時的學習率與訓練所述語義分割初始模型時的學習率的比值在[1/5,1/2]之間。
9.根據權利要求6所述的圖像語義分割模型訓練方法,其特征在于,所述第二訓練集中的訓練圖像的數量與所述第一訓練集中的訓練圖像的數量的比值范圍為[1/10,1]。
10.根據權利要求1所述的圖像語義分割模型訓練方法,其特征在于,所述基礎網絡中的ResnetX網絡為Resnet18網絡、Resnet34網絡、Resnet50網絡、Resnet101網絡和Resnet152網絡中的一種。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京文安智能技術股份有限公司,未經北京文安智能技術股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210103540.7/1.html,轉載請聲明來源鉆瓜專利網。





