[發明專利]場景分割網絡訓練方法、裝置、計算設備及存儲介質有效
| 申請號: | 201710908431.1 | 申請日: | 2017-09-29 |
| 公開(公告)號: | CN107730514B | 公開(公告)日: | 2021-02-12 |
| 發明(設計)人: | 張蕊;顏水成;唐勝 | 申請(專利權)人: | 北京奇寶科技有限公司 |
| 主分類號: | G06T7/11 | 分類號: | G06T7/11;G06T7/136 |
| 代理公司: | 深圳市世紀恒程知識產權代理事務所 44287 | 代理人: | 胡海國 |
| 地址: | 100000 北京市朝陽區酒*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 場景 分割 網絡 訓練 方法 裝置 計算 設備 存儲 介質 | ||
本發明公開了一種場景分割網絡訓練方法、裝置、計算設備及計算機存儲介質,其中,該方法通過多次迭代完成;提取樣本圖像以及標注場景分割結果;將樣本圖像輸入至場景分割網絡中進行訓練,其中,在場景分割網絡中至少一層卷積層,利用尺度回歸層輸出的尺度系數對該卷積層的第一卷積塊進行縮放處理,得到第二卷積塊,而后利用第二卷積塊進行該卷積層的卷積運算,獲得該卷積層的輸出結果;獲取對應的樣本場景分割結果;根據樣本場景分割結果與標注場景分割結果之間的分割損失,更新場景分割網絡的權重參數;迭代執行上述訓練步驟,直至滿足預定收斂條件。該技術方案實現了對感受野的自適應縮放,提高了圖像場景分割的準確率以及處理效率。
技術領域
本發明涉及圖像處理技術領域,具體涉及一種場景分割網絡訓練方法、裝置、計算設備及計算機存儲介質。
背景技術
在現有技術中,分割網絡的訓練主要是基于深度學習中的全卷積神經網絡,利用遷移學習的思想,將在大規模分類數據集上經過預訓練得到的網絡遷移到圖像分割數據集上進行訓練,從而得到用于場景分割的分割網絡。
現有技術中訓練分割網絡時所使用的網絡架構直接利用了圖像分類網絡,其卷積層中卷積塊的大小是固定不變的,從而感受野的大小是固定不變的,其中,感受野是指輸出特征圖某個節點的響應對應的輸入圖像的區域,大小固定的感受野只適于捕捉固定大小和尺度的目標。然而對于圖像場景分割,場景中經常會包含不同大小的目標,利用具有大小固定的感受野的分割網絡在處理過大和過小的目標時常常會發生問題,例如,對于較小的目標,感受野會捕捉過多的目標周圍的背景,從而將目標與背景混淆,導致目標遺漏并被錯判為背景;對于較大的目標,感受野僅僅能捕捉目標的一部分,使得目標類別判斷出現偏差,導致不連續的分割結果。因此,現有技術中訓練得到的分割網絡存在著圖像場景分割的準確率低下的問題。
發明內容
鑒于上述問題,提出了本發明以便提供一種克服上述問題或者至少部分地解決上述問題的場景分割網絡訓練方法、裝置、計算設備及計算機存儲介質。
根據本發明的一個方面,提供了一種場景分割網絡訓練方法,該方法通過多次迭代完成;
其中一次迭代過程的訓練步驟包括:
提取樣本圖像以及與樣本圖像對應的標注場景分割結果;
將樣本圖像輸入至場景分割網絡中進行訓練,其中,在場景分割網絡中至少一層卷積層,利用尺度回歸層輸出的尺度系數對該卷積層的第一卷積塊進行縮放處理,得到第二卷積塊,而后利用第二卷積塊進行該卷積層的卷積運算,獲得該卷積層的輸出結果;尺度回歸層為場景分割網絡的中間卷積層;
獲取與樣本圖像對應的樣本場景分割結果;
根據樣本場景分割結果與標注場景分割結果之間的分割損失,更新場景分割網絡的權重參數;
該方法包括:迭代執行上述訓練步驟,直至滿足預定收斂條件。
進一步地,提取樣本圖像以及與樣本圖像對應的標注場景分割結果進一步包括:
從樣本庫中提取樣本圖像以及與樣本圖像對應的標注場景分割結果。
進一步地,利用尺度回歸層輸出的尺度系數對該卷積層的第一卷積塊進行縮放處理,得到第二卷積塊進一步包括:
利用上一次迭代過程尺度回歸層輸出的尺度系數或者初始尺度系數對該卷積層的第一卷積塊進行縮放處理,得到第二卷積塊。
進一步地,利用第二卷積塊進行該卷積層的卷積運算,獲得該卷積層的輸出結果進一步包括:
利用線性插值方法,從第二卷積塊中采樣得到特征向量,組成第三卷積塊;
依據第三卷積塊與該卷積層的卷積核進行卷積運算,獲得該卷積層的輸出結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京奇寶科技有限公司,未經北京奇寶科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710908431.1/2.html,轉載請聲明來源鉆瓜專利網。





