[發(fā)明專利]模型訓練方法、文本識別方法、裝置、設備和介質有效
| 申請?zhí)枺?/td> | 202111464610.3 | 申請日: | 2021-12-03 |
| 公開(公告)號: | CN113887535B | 公開(公告)日: | 2022-04-12 |
| 發(fā)明(設計)人: | 秦勇 | 申請(專利權)人: | 北京世紀好未來教育科技有限公司 |
| 主分類號: | G06V30/413 | 分類號: | G06V30/413;G06V10/774;G06V10/82;G06K9/62;G06N3/04 |
| 代理公司: | 北京開陽星知識產(chǎn)權代理有限公司 11710 | 代理人: | 唐博 |
| 地址: | 100089 北京市海淀區(qū)中*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 模型 訓練 方法 文本 識別 裝置 設備 介質 | ||
本公開涉及模型訓練方法、文本識別方法、裝置、設備和介質,包括:利用第一訓練樣本訓練第一候選模型中的第一候選分支和第二候選分支,得到訓練后的第一目標分支,第一訓練樣本包括第一文本圖像以及第一文本圖像對應的文本字符,第二候選分支采用循環(huán)神經(jīng)網(wǎng)絡;基于訓練后的第一目標分支和第三候選分支構建第二候選模型,并利用第二訓練樣本訓練第二候選模型得到文本識別模型,第二訓練樣本包括第二文本圖像以及第二文本圖像對應的文本字符,第三候選分支采用圖神經(jīng)網(wǎng)絡,實現(xiàn)快速準確的文本識別。
技術領域
本公開涉及文本識別技術領域,尤其涉及模型訓練方法、文本識別方法、裝置、設備和介質。
背景技術
當前文本識別技術應用范圍廣泛,是很多計算機視覺任務的前置步驟,例如圖像識別、文字識別、身份識別等,文本識別的主要目的是定位文本行或字符在圖像中的位置。相較于通用第二識別而言,文本具有多方向、不規(guī)則形狀、極端長寬比、字體、顏色、背景多樣等特點,因此對文本的精準定位既十分重要又具有挑戰(zhàn)性。
目前常見的文本檢測方法大致包括兩類,一類方案是基于自底向上的策略,將識別問題拆分為字符檢測、字符識別和字符組合,逐個解決,該方法的優(yōu)點是識別結果準確,缺點是需要字符級別的標注,即每個字符在輸入圖像上的位置、以及信息都需要標注,需要耗費大量的人工成本;另一類方案是基于整體分析的策略,即序列到序列的方法,先將圖像編碼,然后進行序列解碼直接得出整個字符串,該方法的優(yōu)點是標注簡單,只需要轉錄字符串即可,缺點是存在識別結果多識別字符或漏識別字符的情況。
現(xiàn)有的文本識別方法,難以滿足實際應用場景的速度需求和精度要求。
發(fā)明內(nèi)容
為了解決上述技術問題或者至少部分地解決上述技術問題,本公開提供了一種模型訓練方法、文本識別方法、裝置、設備和介質。
第一方面,本公開提供了文本識別模型訓練方法,包括:
利用第一訓練樣本訓練第一候選模型中的第一候選分支和第二候選分支,得到訓練后的第一目標分支,所述第一訓練樣本包括第一文本圖像以及第一文本圖像對應的文本字符,所述第二候選分支采用循環(huán)神經(jīng)網(wǎng)絡;
基于所述訓練后的第一目標分支和第三候選分支構建第二候選模型,并利用第二訓練樣本訓練所述第二候選模型得到所述文本識別模型,所述第二訓練樣本包括第二文本圖像以及第二文本圖像對應的文本字符,所述第三候選分支采用圖神經(jīng)網(wǎng)絡。
第二方面,本公開提供了一種文本識別方法,所述方法包括:
獲取待識別的文本圖像;
將所述待識別的文本圖像輸入文本識別模型中,并根據(jù)所述文本識別模型的輸出結果確定所述待識別的文本圖像的文本信息;
其中,所述文本識別模型基于如第一方面任一項所述的方法訓練得到。
第三方面,本公開提供了一種文本識別模型訓練裝置,包括:
第一目標分支和第二目標分支確定模塊,用于利用第一訓練樣本訓練第一候選模型中的第一候選分支和第二候選分支,得到訓練后的第一目標分支和第二目標分支,所述第一訓練樣本包括第一文本圖像以及第一文本圖像對應的文本字符,所述第二候選分支采用循環(huán)神經(jīng)網(wǎng)絡;
文本識別模塊確定模塊,用于基于所述訓練后的第一目標分支和第三候選分支構建第二候選模型,并利用第二訓練樣本訓練所述第二候選模型得到所述文本識別模型,所述第二訓練樣本包括第二文本圖像以及第二文本圖像對應的文本字符,所述第三候選分支采用圖神經(jīng)網(wǎng)絡。
第四方面,本公開實施例提供一種文本識別裝置,包括:
文本圖像獲取模塊,用于獲取待識別的文本圖像;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京世紀好未來教育科技有限公司,未經(jīng)北京世紀好未來教育科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111464610.3/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。





