[發明專利]文字識別方法及裝置、存儲介質有效
| 申請號: | 202011111198.2 | 申請日: | 2020-10-16 |
| 公開(公告)號: | CN112200188B | 公開(公告)日: | 2023-09-12 |
| 發明(設計)人: | 蔡曉聰;侯軍;伊帥 | 申請(專利權)人: | 北京市商湯科技開發有限公司 |
| 主分類號: | G06V20/62 | 分類號: | G06V20/62;G06V30/19;G06V10/82;G06N3/09;G06N3/0985;G06N3/084 |
| 代理公司: | 北京博思佳知識產權代理有限公司 11415 | 代理人: | 靳玫 |
| 地址: | 100080 北京市海淀區北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文字 識別 方法 裝置 存儲 介質 | ||
本公開提供了一種文字識別方法及裝置、存儲介質,其中,所述方法包括:獲取包括待識別文字的文字圖像,所述待識別文字的識別難度超過預設識別難度;確定所述文字圖像對應的特征序列;基于所述文字圖像對應的特征序列,確定對所述待識別文字進行文字識別的文字識別結果。
技術領域
本公開涉及計算機視覺領域,尤其涉及一種文字識別方法及裝置、存儲介質。
背景技術
在不同應用場景中進行文字識別,已經成為計算機視覺以及智能視頻分析的一大研究方向。目前,圍繞除了中文之外的其他文字進行的文字識別研究,更多的還是圍繞于拉丁文和/或英文來進行的。
發明內容
本公開提供了一種文字識別方法及裝置、存儲介質。
根據本公開實施例的第一方面,提供一種文字識別方法,所述方法包括:獲取包括待識別文字的文字圖像,所述待識別文字的識別難度超過預設識別難度;確定所述文字圖像對應的特征序列;基于所述文字圖像對應的特征序列,確定對所述待識別文字進行文字識別的文字識別結果。
在一些可選實施例中,所述確定所述文字圖像對應的特征序列,包括:確定所述文字圖像中所述待識別文字所在的候選區域;將所述候選區域劃分為多個子區域;基于所述多個子區域中至少部分子區域對應的特征信息,確定所述文字圖像對應的特征序列。
在一些可選實施例中,所述基于所述文字圖像對應的特征序列,確定對所述待識別文字進行文字識別的文字識別結果,包括:基于所述文字圖像對應的特征序列,確定與所述文字圖像包括的每個字符對應的至少一個備選字符和每個備選字符對應的識別率;將與所述每個字符對應的所述至少一個備選字符和所述每個備選字符對應的識別率作為所述文字識別結果,或將與所述每個字符對應的所述識別率最大的備選字符作為所述文字識別結果。
在一些可選實施例中,所述確定所述文字圖像對應的特征序列,包括:將所述文字圖像作為用于對所述待識別文字進行文字識別的目標神經網絡的輸入,獲得所述目標神經網絡輸出的所述文字圖像對應的特征序列。
在一些可選實施例中,所述方法還包括:確定所述待識別文字對應的待處理樣本語料;基于所述待處理樣本語料,生成所述待識別文字對應的樣本文字圖像;將所述待識別文字對應的樣本文字圖像作為預設神經網絡的輸入,以所述待處理樣本語料為監督,對所述預設神經網絡進行訓練,得到用于對所述待識別文字進行文字識別的目標神經網絡。
在一些可選實施例中,所述確定所述待識別文字對應的待處理樣本語料,包括:獲取第一備選語料;其中,所述第一備選語料是第一文字語言對應的樣本語料,所述第一文字語言是所述待識別文字對應的文字語言;基于所述第一備選語料包括的字符、詞和語句中的一類對應的多個元素進行組合,或是基于所述第一備選預料包括的字符、詞和語句中的多類分別對應的一個或多個元素進行組合,得到第二備選語料;基于所述第一備選語料和所述第二備選語料中的至少一項,得到所述待處理樣本語料。
在一些可選實施例中,所述確定所述待識別文字對應的待處理樣本語料,包括:獲取第三備選語料;其中,所述第三備選語料是不同于所述第一文字語言的第二文字語言對應的樣本語料;基于所述第三備選語料,得到所述待處理樣本語料。
在一些可選實施例中,所述基于所述第三備選語料,得到所述待處理樣本語料,包括:對所述第三備選語料進行文字語言轉換,得到所述待處理樣本語料。
在一些可選實施例中,所述基于所述待處理樣本語料,生成所述待識別文字對應的樣本文字圖像,包括:基于至少一種字體對所述待處理樣本語料進行字體轉換,得到處理后樣本語料;基于所述處理后樣本語料和背景圖,生成所述待識別文字對應的樣本文字圖像。
在一些可選實施例中,所述待識別文字屬于以下至少一項所對應的文字:所述待識別文字的文字形態對應的復雜度超過預設復雜度;所述待識別文字對應的已有樣本文字數據量少于預設數據量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京市商湯科技開發有限公司,未經北京市商湯科技開發有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011111198.2/2.html,轉載請聲明來源鉆瓜專利網。





