[發明專利]模型訓練方法、圖像處理方法、裝置、計算機系統和介質有效
| 申請號: | 202010583283.2 | 申請日: | 2020-06-23 |
| 公開(公告)號: | CN111723815B | 公開(公告)日: | 2023-06-30 |
| 發明(設計)人: | 周靜玲;羅偉;胡銳明;江子揚 | 申請(專利權)人: | 中國工商銀行股份有限公司 |
| 主分類號: | G06V30/19 | 分類號: | G06V30/19;G06V30/148;G06V10/80;G06V10/82;G06N3/045;G06N3/0464;G06N3/047;G06N3/048;G06N3/084;G07D7/20;G07D7/0047 |
| 代理公司: | 中科專利商標代理有限責任公司 11021 | 代理人: | 楊靜 |
| 地址: | 100140 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 模型 訓練 方法 圖像 處理 裝置 計算機系統 介質 | ||
1.一種模型訓練方法,應用于計算機系統,所述方法包括:
構建初始網絡模型;
獲取包含冠字號字符的多個樣本圖像和所述多個樣本圖像各自的標簽集,所述多個樣本圖像中的每個樣本圖像的標簽集包括:針對所述每個樣本圖像中每個像素點的類別標簽;
基于所述多個樣本圖像和所述多個樣本圖像各自的標簽集,對所述初始網絡模型進行訓練,以得到目標網絡模型,所述目標網絡模型用于進行冠字號字符的分割;
其中,所述初始網絡模型包括:多個第一卷積層、第二卷積層、第三卷積層、第四卷積層、第一反卷積層、第二反卷積層和輸出層;
將所述任一樣本圖像輸入至所述初始網絡模型,以由所述初始網絡模型輸出針對所述任一樣本圖像中每個像素點的分類預測得分包括:
針對所述任一樣本圖像,依次利用所述多個第一卷積層和所述第二卷積層進行處理,以得到第一特征圖,所述第一特征圖的尺寸與所述任一樣本圖像的尺寸相同;
利用所述第三卷積層對所述多個第一卷積層中的一個第一卷積層的輸出進行處理,以得到第二特征圖,所述第二特征圖的尺寸小于所述任一樣本圖像的尺寸;
利用所述第一反卷積層對所述第二特征圖進行處理,以得到第三特征圖,所述第三特征圖的尺寸大于等于所述任一樣本圖像的尺寸;
利用所述第四卷積層對所述第二卷積層的輸出進行處理,以得到第四特征圖,所述第四特征圖的尺寸小于所述任一樣本圖像的尺寸;
利用所述第二反卷積層對所述第四特征圖進行處理,以得到第五特征圖,所述第五特征圖的尺寸大于等于所述任一樣本圖像的尺寸;以及
對所述第三特征圖和所述第五特征圖進行融合,以得到融合結果;以及
利用所述輸出層基于所述融合結果,得到針對所述任一樣本圖像中每個像素點的分類預測得分。
2.根據權利要求1所述的方法,其中,所述基于所述多個樣本圖像和所述多個樣本圖像各自的標簽集,對所述初始網絡模型進行訓練包括:
針對所述多個樣本圖像中的任一樣本圖像,
將所述任一樣本圖像輸入至所述初始網絡模型,以由所述初始網絡模型輸出針對所述任一樣本圖像中每個像素點的分類預測得分;
基于所述任一樣本圖像中每個像素點的分類預測得分和所述任一樣本圖像的標簽集,計算預定損失函數的損失值;
基于預定損失函數的損失值,對所述初始網絡模型的參數進行調整,以得到更新的初始網絡模型;
針對所述更新的初始網絡模型,重復上述訓練過程,直至基于預定損失函數的損失值確定預定損失函數實現收斂;以及
將預定損失函數實現收斂時所針對的初始網絡模型作為所述目標網絡模型。
3.根據權利要求1所述的方法,其中,所述初始網絡模型還包括隨機失活層,所述隨機失活層位于所述第二卷積層之后;
所述基于所述多個樣本圖像和所述多個樣本圖像各自的標簽集,對所述初始網絡模型進行訓練還包括:
將所述多個樣本圖像劃分為多個訓練批次,逐訓練批次地對所述初始網絡模型進行訓練;以及
當基于所述多個訓練批次中的每個訓練批次對所述初始網絡模型進行訓練時,利用所述隨機失活層設置所述初始網絡模型中的一個或多個神經元失活。
4.根據權利要求3所述的方法,其中,所述第三特征圖和所述第五特征圖的尺寸均大于所述任一樣本圖像的尺寸;
所述基于所述多個樣本圖像和所述多個樣本圖像各自的標簽集,對所述初始網絡模型進行訓練還包括:在對所述第三特征圖和所述第五特征圖進行融合之前,對所述第三特征圖和所述第五特征圖進行裁剪,使得裁剪后的第三特征圖的尺寸、裁剪后的第五特征圖的尺寸均與所述任一樣本圖像的尺寸相同。
5.根據權利要求3所述的方法,其中,所述對所述第三特征圖和所述第五特征圖進行融合包括:
將所述第三特征圖和所述第五特征圖中位于相同通道的特征值進行相加,以得到初步融合圖;以及
利用預定卷積核對所述初步融合圖進行卷積操作,以得到融合結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國工商銀行股份有限公司,未經中國工商銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010583283.2/1.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





