[發明專利]一種識別模型的訓練方法及訓練裝置在審
| 申請號: | 202210037227.8 | 申請日: | 2022-01-13 |
| 公開(公告)號: | CN114429575A | 公開(公告)日: | 2022-05-03 |
| 發明(設計)人: | 姜仟藝;宋祺;魏曉明 | 申請(專利權)人: | 北京三快在線科技有限公司 |
| 主分類號: | G06V10/774 | 分類號: | G06V10/774;G06V30/148;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京曼威知識產權代理有限公司 11709 | 代理人: | 鄧超 |
| 地址: | 100080 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 識別 模型 訓練 方法 裝置 | ||
本說明書公開了一種識別模型的訓練方法及訓練裝置,該識別模型的訓練方法包括:獲取各樣本圖像,所述各樣本圖像中包含有文字信息,將所述各樣本圖像輸入到識別模型中,確定所述各樣本圖像中包含的各字符對應的字符特征圖,通過所述識別模型將所述各字符對應的字符特征圖投影到高維空間中,確定所述各字符對應的字符特征圖在所述高維空間中的字符特征表示,以不同形態的相同字符的字符特征表示靠近同一特征中心,不同特征中心在所述高維空間中的距離越遠為優化目標,調整不同特征中心在所述高維空間中的位置,以對所述識別模型進行訓練,其中,所述高維空間的不同特征中心對應不同的字符。
技術領域
本說明書涉及文字識別技術領域,尤其涉及一種識別模型的訓練方法及訓練裝置
背景技術
隨著科技的發展,文字識別技術已經被應用到諸如遠程身份認證、財稅報銷、內容審核以及文檔電子化等各個場景當中,在縮減人力成本的同時,也為用戶的工作生活提供了極大的便利,在文字識別的過程中,識別模型的準確性往往對文字識別的結果起著至關重要的作用。
然而,如果采用有監督學習的方式對識別模型進行訓練,若想達到訓練效果就需要消耗大量的人工成本及時間來對樣本數據進行標注,而若是采用其他的訓練方法,則無法對無標簽訓練樣本達到充分的利用,而且限制了識別模型準確率。
因此,如何在減小模型訓練的人工成本和時間的同時,提高識別模型的準確率,是一個亟待解決的問題。
發明內容
本說明書提供一種識別模型的訓練方法及訓練裝置,以部分的解決現有技術存在的上述問題。
本說明書采用下述技術方案:
本說明書提供了一種識別模型的訓練方法,包括:
獲取各樣本圖像,所述各樣本圖像中包含有文字信息;
將所述各樣本圖像輸入到識別模型中,確定所述各樣本圖像中包含的各字符對應的字符特征圖;
通過所述識別模型將所述各字符對應的字符特征圖投影到高維空間中,確定所述各字符對應的字符特征圖在所述高維空間中的字符特征表示;
以不同形態的相同字符的字符特征表示靠近同一特征中心,不同特征中心在所述高維空間中的距離越遠為優化目標,調整不同特征中心在所述高維空間中的位置,以對所述識別模型進行訓練,其中,所述高維空間的不同特征中心對應不同的字符。
可選地,將所述各樣本圖像輸入到識別模型中,確定所述各樣本圖像中包含的各字符對應的字符特征圖,具體包括:
將所述各樣本圖像輸入到識別模型中,確定所述各樣本圖像對應的各字符串特征圖,其中,每一字符串特征圖對應一個字符串;
對所述各字符串特征圖進行分割,以確定所述各樣本圖像中包含的各字符對應的字符特征圖。
可選地,對所述各字符串特征圖進行分割,以確定所述各樣本圖像中包含的各字符對應的字符特征圖,具體包括:
針對每一樣本圖像,對該樣本圖像對應的字符串特征圖進行分割,得到該樣本圖像中包含的每一子特征圖;
保留包含至少部分字符特征的子特征圖,作為該樣本圖像中包含的各字符對應的字符特征圖。
可選地,通過所述識別模型將所述各字符對應的字符特征圖投影到高維空間中,確定所述各字符對應的字符特征圖在所述高維空間中的字符特征表示,具體包括:
將所述各樣本圖像輸入所述識別模型中,確定所述各樣本圖像中包含的每一字符的識別結果,以及每一字符的識別結果對應的準確率;
根據所述每一字符的識別結果對應的準確率,濾除所述準確率低于預設閾值的字符特征圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京三快在線科技有限公司,未經北京三快在線科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210037227.8/2.html,轉載請聲明來源鉆瓜專利網。





