[發明專利]一種識別模型的訓練方法及訓練裝置在審
| 申請號: | 202210037227.8 | 申請日: | 2022-01-13 |
| 公開(公告)號: | CN114429575A | 公開(公告)日: | 2022-05-03 |
| 發明(設計)人: | 姜仟藝;宋祺;魏曉明 | 申請(專利權)人: | 北京三快在線科技有限公司 |
| 主分類號: | G06V10/774 | 分類號: | G06V10/774;G06V30/148;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京曼威知識產權代理有限公司 11709 | 代理人: | 鄧超 |
| 地址: | 100080 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 識別 模型 訓練 方法 裝置 | ||
1.一種識別模型的訓練方法,其特征在于,包括:
獲取各樣本圖像,所述各樣本圖像中包含有文字信息;
將所述各樣本圖像輸入到識別模型中,確定所述各樣本圖像中包含的各字符對應的字符特征圖;
通過所述識別模型將所述各字符對應的字符特征圖投影到高維空間中,確定所述各字符對應的字符特征圖在所述高維空間中的字符特征表示;
以不同形態的相同字符的字符特征表示靠近同一特征中心,不同特征中心在所述高維空間中的距離越遠為優化目標,調整不同特征中心在所述高維空間中的位置,以對所述識別模型進行訓練,其中,所述高維空間的不同特征中心對應不同的字符。
2.如權利要求1所述的方法,其特征在于,將所述各樣本圖像輸入到識別模型中,確定所述各樣本圖像中包含的各字符對應的字符特征圖,具體包括:
將所述各樣本圖像輸入到識別模型中,確定所述各樣本圖像對應的各字符串特征圖,其中,每一字符串特征圖對應一個字符串;
對所述各字符串特征圖進行分割,以確定所述各樣本圖像中包含的各字符對應的字符特征圖。
3.如權利要求2所述的方法,其特征在于,對所述各字符串特征圖進行分割,以確定所述各樣本圖像中包含的各字符對應的字符特征圖,具體包括:
針對每一樣本圖像,對該樣本圖像對應的字符串特征圖進行分割,得到該樣本圖像中包含的每一子特征圖;
保留包含至少部分字符特征的子特征圖,作為該樣本圖像中包含的各字符對應的字符特征圖。
4.如權利要求1所述的方法,其特征在于,通過所述識別模型將所述各字符對應的字符特征圖投影到高維空間中,確定所述各字符對應的字符特征圖在所述高維空間中的字符特征表示,具體包括:
將所述各樣本圖像輸入所述識別模型中,確定所述各樣本圖像中包含的每一字符的識別結果,以及每一字符的識別結果對應的準確率;
根據所述每一字符的識別結果對應的準確率,濾除所述準確率低于預設閾值的字符特征圖;
將濾除后的字符特征圖投影到高維空間中,確定濾除后的各字符特征圖在所述高維空間中的字符特征表示。
5.如權利要求1所述的方法,其特征在于,以不同形態的相同字符的字符特征表示靠近同一特征中心,不同特征中心在所述高維空間中的距離越遠為優化目標,調整不同特征中心在所述高維空間中的位置,以對所述識別模型進行訓練,具體包括:
根據所述高維空間中每一字符特征表示與每一樣本中心之間的距離,確定所述識別模型的對比損失函數的損失值,其中,不同形態的相同字符的字符特征表示越靠近同一特征中心,所述對比損失函數的損失值越小,不同特征中心在所述高維空間中的距離越遠,所述對比損失函數的損失值越小;
以所述對比損失函數的損失值最小化為優化目標,調整所述識別模型的模型參數以及不同特征中心在所述高維空間中的位置,以對所述識別模型進行訓練。
6.如權利要求5所述的方法,其特征在于,以所述對比損失函數的損失值最小化為優化目標,調整所述識別模型的模型參數以及不同特征中心在所述高維空間中的位置,以對所述識別模型進行訓練,具體包括:
針對每個樣本圖像,確定所述識別模型對該樣本圖像的識別結果,與該樣本圖像對應的實際文字信息之間的偏差,作為該樣本圖像對應的偏差;
以所述對比損失函數的損失值最小化,以及所述各樣本圖像對應的偏差最小化為優化目標,調整所述識別模型的模型參數以及不同特征中心在所述高維空間中的位置,以對所述識別模型進行訓練。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京三快在線科技有限公司,未經北京三快在線科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210037227.8/1.html,轉載請聲明來源鉆瓜專利網。





