[發(fā)明專利]圖像分割模型訓(xùn)練方法、裝置、計算機設(shè)備和存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 202110390733.0 | 申請日: | 2021-04-12 |
| 公開(公告)號: | CN113112509B | 公開(公告)日: | 2023-07-04 |
| 發(fā)明(設(shè)計)人: | 賴昕;田倬韜;劉樞;沈小勇;呂江波 | 申請(專利權(quán))人: | 深圳思謀信息科技有限公司;上海思謀科技有限公司 |
| 主分類號: | G06T7/11 | 分類號: | G06T7/11 |
| 代理公司: | 華進聯(lián)合專利商標(biāo)代理有限公司 44224 | 代理人: | 紀婷婧 |
| 地址: | 518051 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 圖像 分割 模型 訓(xùn)練 方法 裝置 計算機 設(shè)備 存儲 介質(zhì) | ||
本申請涉及一種圖像分割模型訓(xùn)練方法、裝置、計算機設(shè)備和存儲介質(zhì)。所述方法包括:獲取第一樣本圖像、第二樣本圖像,以及與第一樣本圖像對應(yīng)的標(biāo)注圖像;將第一樣本圖像和標(biāo)注圖像以及第二樣本圖像輸入至待訓(xùn)練的圖像分割模型,以使待訓(xùn)練的圖像分割模型根據(jù)第一樣本圖像對應(yīng)的預(yù)測圖像以及標(biāo)注圖像,得到第一損失值,以及根據(jù)第一圖像塊和第二圖像塊的特征圖關(guān)于圖像重疊區(qū)域的特征相似度,得到第二損失值;第一圖像塊和第二圖像塊為第二樣本圖像中具有圖像重疊區(qū)域的圖像塊;基于第一損失值和第二損失值,訓(xùn)練得到圖像分割模型。采用本方法能夠提高得到的圖像分割模型的圖像分割準(zhǔn)確率。
技術(shù)領(lǐng)域
本申請涉及圖像分割技術(shù)領(lǐng)域,特別是涉及一種圖像分割模型訓(xùn)練方法、裝置、計算機設(shè)備和存儲介質(zhì)。
背景技術(shù)
隨著圖像分割技術(shù)的發(fā)展,出現(xiàn)了一種利用深度學(xué)習(xí)算法實現(xiàn)圖像分割模型訓(xùn)練,并利用訓(xùn)練后的圖像分割模型實現(xiàn)圖像分割的技術(shù)。目前,圖像分割模型需要大量的像素級別的標(biāo)注數(shù)據(jù)支撐,而由于實際應(yīng)用中獲取像素級別的標(biāo)注數(shù)據(jù)的代價昂貴,因此提出了一種半監(jiān)督圖像分割模型訓(xùn)練方法,只需要少部分圖像的標(biāo)注數(shù)據(jù)以及其他無標(biāo)注的圖像即可完成圖像分割模型的訓(xùn)練。
目前的半監(jiān)督圖像分割模型訓(xùn)練方法一般采用對抗學(xué)習(xí)或者一致學(xué)習(xí)的方式進行訓(xùn)練。然而,對抗學(xué)習(xí)訓(xùn)練方法中需要將訓(xùn)練分成生成器訓(xùn)練和判別器訓(xùn)練兩部分,從而導(dǎo)致訓(xùn)練的不穩(wěn)定,而一致學(xué)習(xí)的訓(xùn)練方法則需要由同一輸入經(jīng)過不同的數(shù)據(jù)增強產(chǎn)生多個新圖像,并要求多個新圖像保持一致作為監(jiān)督信號,而對于同一圖像的不同表現(xiàn)的一致性則缺乏約束,因此目前通過半監(jiān)督圖像分割模型訓(xùn)練方法得到的圖像分割模型圖像分割準(zhǔn)確率較低。
發(fā)明內(nèi)容
基于此,有必要針對上述技術(shù)問題,提供一種圖像分割模型訓(xùn)練方法、裝置、計算機設(shè)備和存儲介質(zhì)。
一種圖像分割模型訓(xùn)練方法,所述方法包括:
獲取第一樣本圖像、第二樣本圖像,以及與所述第一樣本圖像對應(yīng)的標(biāo)注圖像;
將所述第一樣本圖像和標(biāo)注圖像以及所述第二樣本圖像輸入至待訓(xùn)練的圖像分割模型,以使所述待訓(xùn)練的圖像分割模型根據(jù)所述第一樣本圖像對應(yīng)的預(yù)測圖像以及所述標(biāo)注圖像,得到第一損失值,以及根據(jù)第一圖像塊和第二圖像塊的特征圖關(guān)于圖像重疊區(qū)域的特征相似度,得到第二損失值;所述第一圖像塊和第二圖像塊為所述第二樣本圖像中具有所述圖像重疊區(qū)域的圖像塊;
基于所述第一損失值和所述第二損失值,訓(xùn)練得到圖像分割模型。
在其中一個實施例中,所述圖像分割模型包括映射器;所述根據(jù)第一圖像塊和第二圖像塊的特征圖關(guān)于圖像重疊區(qū)域的特征相似度,得到第二損失值,包括:將所述第一圖像塊和第二圖像塊的特征圖輸入所述映射器,通過所述映射器獲取所述第一圖像塊的特征圖對應(yīng)的第一映射特征圖以及所述第二圖像塊的特征圖對應(yīng)的第二特征映射圖;確定所述第一映射特征圖在所述重疊圖像區(qū)域中的第一重疊特征,并獲取所述第一重疊特征在所述第二特征映射圖的重疊圖像區(qū)域中對應(yīng)的第二重疊特征;根據(jù)所述第一重疊特征與所述第二重疊特征的特征相似度得到所述第二損失值。
在其中一個實施例中,所述第一重疊特征的個數(shù)為多個;所述根據(jù)所述第一重疊特征與所述第二重疊特征的特征相似度得到所述第二損失值,包括:確定當(dāng)前第一重疊特征,以及所述當(dāng)前第一重疊特征對應(yīng)的第二重疊特征,作為當(dāng)前第二重疊特征;根據(jù)所述當(dāng)前第一重疊特征與所述當(dāng)前第二重疊特征的特征相似度得到所述當(dāng)前第一重疊特征的特征損失值;確定各第一重疊特征對應(yīng)的特征損失值,根據(jù)所述各第一重疊特征對應(yīng)的特征損失值的平均值作為所述第二損失值。
在其中一個實施例中,所述圖像分割模型包括分類器;所述分類器用于獲取所述第一圖像塊的特征圖對應(yīng)的第一偽標(biāo)簽,以及所述第二圖像塊的特征圖對應(yīng)的第二偽標(biāo)簽;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳思謀信息科技有限公司;上海思謀科技有限公司,未經(jīng)深圳思謀信息科技有限公司;上海思謀科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110390733.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





