[發(fā)明專利]字符識別模型訓(xùn)練方法及裝置、識別字符的方法及裝置有效
| 申請?zhí)枺?/td> | 201810973521.3 | 申請日: | 2018-08-24 |
| 公開(公告)號: | CN110858307B | 公開(公告)日: | 2022-09-13 |
| 發(fā)明(設(shè)計)人: | 江建軍;鄭凱;段立新;李建麗 | 申請(專利權(quán))人: | 國信優(yōu)易數(shù)據(jù)股份有限公司 |
| 主分類號: | G06V30/148 | 分類號: | G06V30/148;G06V30/19;G06V10/82 |
| 代理公司: | 北京超凡志成知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11371 | 代理人: | 楊奇松 |
| 地址: | 100000 北京市豐臺區(qū)南四環(huán)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 字符 識別 模型 訓(xùn)練 方法 裝置 | ||
1.一種字符識別模型訓(xùn)練方法,其特征在于,包括:
獲取樣本圖像;其中,所述樣本圖像中包含多個樣本內(nèi)容;
確認每個樣本內(nèi)容的內(nèi)容特征信息,以及該樣本內(nèi)容包含的樣本字符之間的關(guān)系概率矩陣;其中,所述樣本內(nèi)容的內(nèi)容特征信息是通過對所述樣本內(nèi)容的圖像區(qū)域進行特征提取得到的,所述樣本內(nèi)容包含的樣本字符之間的關(guān)系概率矩陣用于表征所述樣本內(nèi)容包含的樣本字符之間的關(guān)聯(lián)程度;
將所述每個樣本內(nèi)容的內(nèi)容特征信息,以及該樣本內(nèi)容包含的樣本字符之間的關(guān)系概率矩陣作為待訓(xùn)練字符識別模型的輸入特征,將該樣本內(nèi)容包含的樣本字符作為所述待訓(xùn)練字符識別模型的輸出結(jié)果,訓(xùn)練得到所述字符識別模型。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,將所述每個樣本內(nèi)容的內(nèi)容特征信息,以及該樣本內(nèi)容包含的樣本字符之間的關(guān)系概率矩陣作為待訓(xùn)練字符識別模型的輸入特征,將該樣本內(nèi)容包含的樣本字符作為所述待訓(xùn)練字符識別模型的輸出結(jié)果,訓(xùn)練得到所述字符識別模型,包括:
依次將確定的每個樣本內(nèi)容的內(nèi)容特征信息作為第一字符識別子模型的輸入特征,將對應(yīng)的樣本內(nèi)容作為所述第一字符識別子模型的輸出結(jié)果,對所述第一字符識別子模型進行訓(xùn)練,得到初始訓(xùn)練第一字符識別子模型;
針對所述樣本圖像中的每一樣本內(nèi)容,將該樣本內(nèi)容的內(nèi)容特征信息作為所述初始訓(xùn)練第一字符識別子模型的輸入,得到識別內(nèi)容,將所述識別內(nèi)容作為第二字符識別子模型的輸入特征,將該識別內(nèi)容包含的識別字符之間的關(guān)系概率矩陣作為所述第二字符識別子模型的輸出結(jié)果,對所述第二字符識別子模型進行訓(xùn)練;
針對所述樣本圖像中的每一樣本內(nèi)容,將該樣本內(nèi)容的內(nèi)容特征信息和訓(xùn)練后的第二字符識別子模型對該樣本內(nèi)容對應(yīng)的識別內(nèi)容進行識別得到的關(guān)系概率矩陣作為所述初始訓(xùn)練第一字符識別子模型的輸入特征,對所述初始訓(xùn)練第一字符識別子模型進行再次訓(xùn)練;其中,所述字符識別模型包括再次訓(xùn)練好的初始訓(xùn)練第一字符識別子模型和訓(xùn)練好的第二字符識別子模型。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述將所述識別內(nèi)容作為第二字符識別子模型的輸入特征,將該識別內(nèi)容包含的識別字符之間的關(guān)系概率矩陣作為所述第二字符識別子模型的輸出結(jié)果,包括:
針對所述樣本圖像中的每一樣本內(nèi)容,從所述初始訓(xùn)練第一字符識別子模型對該樣本內(nèi)容識別得到的識別內(nèi)容中,提取所述識別內(nèi)容包含的識別字符的字符編碼矩陣;
將提取的識別字符的字符編碼矩陣作為第二字符識別子模型的輸入特征,將該識別內(nèi)容包含的識別字符之間的關(guān)系概率矩陣作為所述第二字符識別子模型的輸出結(jié)果。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,在對所述第二字符識別子模型進行訓(xùn)練之后,對所述初始訓(xùn)練第一字符識別子模型進行再次訓(xùn)練之前,還包括:
針對所述樣本圖像中的每一樣本內(nèi)容,確定該樣本內(nèi)容對應(yīng)所述樣本圖像的圖像區(qū)域;
基于確定的圖像區(qū)域的大小,對該樣本內(nèi)容對應(yīng)的識別內(nèi)容包含的識別字符之間的關(guān)系概率矩陣進行擴展,得到擴展關(guān)系概率矩陣;
對所述初始訓(xùn)練第一字符識別子模型進行再次訓(xùn)練,包括:
針對所述樣本圖像中的每一樣本內(nèi)容,將該樣本內(nèi)容的內(nèi)容特征信息和訓(xùn)練后的第二字符識別子模型對該樣本內(nèi)容對應(yīng)的識別內(nèi)容進行識別得到關(guān)系概率矩陣后擴展得到的擴展關(guān)系概率矩陣作為所述初始訓(xùn)練第一字符識別子模型的輸入特征,對所述初始訓(xùn)練第一字符識別子模型進行再次訓(xùn)練。
5.一種基于權(quán)利要求1至4中任一項訓(xùn)練出的字符識別模型識別字符的方法,其特征在于,包括:
獲取目標圖像;其中,所述目標圖像中包含多個目標內(nèi)容;
確認每個目標內(nèi)容的內(nèi)容特征信息,以及該目標內(nèi)容包含的目標字符之間的關(guān)系概率矩陣;其中,所述目標內(nèi)容的內(nèi)容特征信息是通過對所述目標內(nèi)容的圖像區(qū)域進行特征提取得到的,所述目標內(nèi)容包含的目標字符之間的關(guān)系概率矩陣用于表征所述目標內(nèi)容包含的目標字符之間的關(guān)聯(lián)程度;
將所述每個目標內(nèi)容的內(nèi)容特征信息,以及該目標內(nèi)容包含的目標字符之間的關(guān)系概率矩陣輸入至所述字符識別模型,識別得到將該目標內(nèi)容包含的目標字符。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于國信優(yōu)易數(shù)據(jù)股份有限公司,未經(jīng)國信優(yōu)易數(shù)據(jù)股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810973521.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:L-半胱氨酸鹽酸鹽一水合物的處理方法
- 下一篇:出票裝置和彩票機器人





