[發明專利]用于生成圖像分割模型的方法和裝置有效
| 申請號: | 201910099310.6 | 申請日: | 2019-01-31 |
| 公開(公告)號: | CN109816670B | 公開(公告)日: | 2020-05-15 |
| 發明(設計)人: | 喻冬東;王長虎 | 申請(專利權)人: | 北京字節跳動網絡技術有限公司 |
| 主分類號: | G06T7/11 | 分類號: | G06T7/11;G06N3/04;G06N3/08 |
| 代理公司: | 北京英賽嘉華知識產權代理有限責任公司 11204 | 代理人: | 王達佐;馬曉亞 |
| 地址: | 100041 北京市石景山區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 生成 圖像 分割 模型 方法 裝置 | ||
1.一種用于生成圖像分割模型的方法,包括:
獲取訓練樣本集合,其中,訓練樣本包括樣本圖像,與樣本圖像對應的關鍵點位置信息和與樣本圖像對應的分割結果;
利用深度學習算法,將所述訓練樣本集合中的訓練樣本包括的樣本圖像作為輸入,將與輸入的樣本圖像對應的分割結果作為期望輸出,基于與輸入的樣本圖像對應的關鍵點位置信息,訓練得到圖像分割模型;
其中,所述將所述訓練樣本集合中的訓練樣本包括的樣本圖像作為輸入,將與輸入的樣本圖像對應的分割結果作為期望輸出,基于與輸入的樣本圖像對應的關鍵點位置信息,訓練得到圖像分割模型,包括:
將所述訓練樣本集合中的訓練樣本包括的樣本圖像作為初始模型的輸入,將與輸入的樣本圖像對應的分割結果作為初始模型的期望輸出,初始模型的網絡結構包括用于輸出關鍵點位置信息的子結構,將與輸入的樣本圖像對應的關鍵點位置信息作為子結構的期望輸出,訓練得到圖像分割模型;
其中,所述初始模型包括的用于輸出關鍵點位置信息的子結構的數量大于等于2;
所述將與輸入的樣本圖像對應的關鍵點位置信息作為子結構的期望輸出,包括:
將與輸入的樣本圖像對應的關鍵點位置信息作為初始模型包括的各個子結構的期望輸出;以及
所述訓練得到圖像分割模型;包括:
基于所述初始模型包括的各個子結構的實際輸出和期望輸出,調整初始模型的模型參數,訓練得到圖像分割模型。
2.根據權利要求1所述的方法,其中,初始模型的網絡結構包括殘差網絡空洞卷積ResNet Dilated Convolution結構。
3.一種用于分割圖像的方法,包括:
獲取待分割圖像;
將所述待分割圖像輸入至預先訓練的圖像分割模型,得到分割結果,其中,所述圖像分割模型是通過如權利要求1-2之一所述的方法訓練得到的。
4.一種用于生成圖像分割模型的裝置,包括:
第一獲取單元,被配置成獲取訓練樣本集合,其中,訓練樣本包括樣本圖像,與樣本圖像對應的關鍵點位置信息和與樣本圖像對應的分割結果;
訓練單元,被配置成利用深度學習算法,將所述訓練樣本集合中的訓練樣本包括的樣本圖像作為輸入,將與輸入的樣本圖像對應的分割結果作為期望輸出,基于與輸入的樣本圖像對應的關鍵點位置信息,訓練得到圖像分割模型;
其中,所述訓練單元被進一步配置成:
將所述訓練樣本集合中的訓練樣本包括的樣本圖像作為初始模型的輸入,將與輸入的樣本圖像對應的分割結果作為初始模型的期望輸出,初始模型的網絡結構包括用于輸出關鍵點位置信息的子結構,將與輸入的樣本圖像對應的關鍵點位置信息作為子結構的期望輸出,訓練得到圖像分割模型;
其中,初始模型包括的用于輸出關鍵點位置信息的子結構的數量大于等于2;
所述訓練單元被進一步配置成:
將與輸入的樣本圖像對應的關鍵點位置信息作為初始模型包括的各個子結構的期望輸出;以及
所述訓練得到圖像分割模型;包括:
基于所述初始模型包括的各個子結構的實際輸出和期望輸出,調整初始模型的模型參數,訓練得到圖像分割模型。
5.根據權利要求4所述的裝置,其中,初始模型的網絡結構包括殘差網絡空洞卷積ResNet Dilated Convolution結構。
6.一種用于分割圖像的裝置,包括:
第二獲取單元,被配置成獲取待分割圖像;
輸入單元,被配置成將所述待分割圖像輸入至預先訓練的圖像分割模型,得到分割結果,其中,所述圖像分割模型是通過如權利要求1-2之一所述的方法訓練得到的。
7.一種服務器,包括:
一個或多個處理器;
存儲裝置,其上存儲有一個或多個程序,
當所述一個或多個程序被所述一個或多個處理器執行,使得所述一個或多個處理器實現如權利要求1-3中任一所述的方法。
8.一種計算機可讀介質,其上存儲有計算機程序,其中,所述程序被處理器執行時實現如權利要求1-3中任一所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京字節跳動網絡技術有限公司,未經北京字節跳動網絡技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910099310.6/1.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





