[發明專利]模型訓練方法、圖像處理方法、裝置、計算機系統和介質有效
| 申請號: | 202010583283.2 | 申請日: | 2020-06-23 |
| 公開(公告)號: | CN111723815B | 公開(公告)日: | 2023-06-30 |
| 發明(設計)人: | 周靜玲;羅偉;胡銳明;江子揚 | 申請(專利權)人: | 中國工商銀行股份有限公司 |
| 主分類號: | G06V30/19 | 分類號: | G06V30/19;G06V30/148;G06V10/80;G06V10/82;G06N3/045;G06N3/0464;G06N3/047;G06N3/048;G06N3/084;G07D7/20;G07D7/0047 |
| 代理公司: | 中科專利商標代理有限責任公司 11021 | 代理人: | 楊靜 |
| 地址: | 100140 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 模型 訓練 方法 圖像 處理 裝置 計算機系統 介質 | ||
本公開提供了一種模型訓練方法,應用于計算機系統。該方法包括:構建初始網絡模型。獲取包含冠字號字符的多個樣本圖像和該多個樣本圖像各自的標簽集,多個樣本圖像中的每個樣本圖像的標簽集包括:針對該樣本圖像中每個像素點的類別標簽。然后,基于多個樣本圖像和多個樣本圖像各自的標簽集,對初始網絡模型進行訓練,以得到目標網絡模型,目標網絡模型用于進行冠字號字符的分割。本公開還提供了一種模型訓練裝置、圖像處理方法、圖像處理裝置、計算機系統和介質。
技術領域
本公開涉及計算機技術領域,更具體地,涉及一種模型訓練方法及裝置、圖像處理方法及裝置、計算機系統和介質。
背景技術
為了保障社會的公平,打擊違法犯罪行為,對紙幣的流通進行有效的監督具有重要的現實意義。冠字號作為紙幣唯一識別標志,冠字號的監控是監控紙幣流通過程的重要環節。為了能夠正確識別冠字號,需要得到完整且準確的單個字符的位置。因此,研究出高速且有效的紙幣冠字號區域字符分割方法是監控紙幣冠字號過程中不可或缺的一步。
傳統的方法一般采用基于閾值的分割方法區分出字符像素和背景像素,再采用投影等方法確定單個字符的位置,從而實現字符的分割。由于紙幣圖像的復雜性,很難通過閾值完全分割開字符像素和背景像素,二值圖像會出現字符間粘粘或者字符筆畫斷裂等情況。傳統的投影分割法的結果太依賴于二值化的結果,因此傳統的分割算法存在很多的局限性。
發明內容
本公開的一個方面提供了一種模型訓練方法,應用于計算機系統。該方法包括:構建初始網絡模型。獲取包含冠字號字符的多個樣本圖像和該多個樣本圖像各自的標簽集,多個樣本圖像中的每個樣本圖像的標簽集包括:針對該樣本圖像中每個像素點的類別標簽。然后,基于多個樣本圖像和多個樣本圖像各自的標簽集,對初始網絡模型進行訓練,以得到目標網絡模型,目標網絡模型用于進行冠字號字符的分割。
可選地,上述基于多個樣本圖像和多個樣本圖像各自的標簽集,對初始網絡模型進行訓練包括:針對多個樣本圖像中的任一樣本圖像,將該樣本圖像輸入至初始網絡模型,以由初始網絡模型輸出針對該樣本圖像中每個像素點的分類預測得分。基于該樣本圖像中每個像素點的分類預測得分和該樣本圖像的標簽集,計算預定損失函數的損失值。基于預定損失函數的損失值,對初始網絡模型的參數進行調整,以得到更新的初始網絡模型。針對更新的初始網絡模型,重復上述訓練過程,直至基于預定損失函數的損失值確定預定損失函數實現收斂。將預定損失函數實現收斂時所針對的初始網絡模型作為目標網絡模型。
可選地,上述初始網絡模型包括:多個第一卷積層、第二卷積層、第三卷積層、第四卷積層、第一反卷積層、第二反卷積層和輸出層。上述將任一樣本圖像輸入至所述初始網絡模型,以由初始網絡模型輸出針對該樣本圖像中每個像素點的分類預測得分包括:針對任一樣本圖像,依次利用上述多個第一卷積層和上述第二卷積層進行處理,以得到第一特征圖,第一特征圖的尺寸與該樣本圖像的尺寸相同。利用上述第三卷積層對多個第一卷積層中的一個第一卷積層的輸出進行處理,以得到第二特征圖,第二特征圖的尺寸小于該樣本圖像的尺寸。利用第一反卷積層對第二特征圖進行處理,以得到第三特征圖,第三特征圖的尺寸大于等于該樣本圖像的尺寸。利用第四卷積層對上述第二卷積層的輸出進行處理,以得到第四特征圖,第四特征圖的尺寸小于該樣本圖像的尺寸。利用第二反卷積層對第四特征圖進行處理,以得到第五特征圖,第五特征圖的尺寸大于等于該樣本圖像的尺寸。接著,對第三特征圖和第五特征圖進行融合,以得到融合結果。利用上述輸出層基于融合結果,得到針對該樣本圖像中每個像素點的分類預測得分。
可選地,初始網絡模型還包括隨機失活層,隨機失活層位于上述第二卷積層之后。上述基于多個樣本圖像和多個樣本圖像各自的標簽集,對初始網絡模型進行訓練還包括:將多個樣本圖像劃分為多個訓練批次,逐訓練批次地對初始網絡模型進行訓練。當基于多個訓練批次中的每個訓練批次對初始網絡模型進行訓練時,利用隨機失活層設置初始網絡模型中的一個或多個神經元失活。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國工商銀行股份有限公司,未經中國工商銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010583283.2/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





