[發明專利]一種字符的確定方法、裝置、電子設置和可讀介質在審
| 申請號: | 202110125543.6 | 申請日: | 2021-01-29 |
| 公開(公告)號: | CN112818976A | 公開(公告)日: | 2021-05-18 |
| 發明(設計)人: | 柯友運;李夢林 | 申請(專利權)人: | 北京秒針人工智能科技有限公司 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20;G06F40/211;G06K9/34;G06N3/08 |
| 代理公司: | 北京華夏泰和知識產權代理有限公司 11662 | 代理人: | 李曼 |
| 地址: | 100041 北京市石景山區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 字符 確定 方法 裝置 電子 設置 可讀 介質 | ||
本申請提供了一種字符的確定方法、裝置、電子設置和可讀介質,屬于識別技術領域。方法包括:將包含有第二字符的目標圖片輸入目標識別模型,得到目標識別模型識別出的第一字符的第一置信度,其中,第一置信度是第一字符為待預測的第二字符的概率;將第二字符的上下文信息輸入語言預測模型,得到語言預測模型輸出的第一字符的第二置信度,其中,第二置信度為第一字符在上下文中為第二字符的概率;根據第一置信度和第二置信度,得到第一字符為第二字符的待選置信度;選取數值最大的待選置信度對應的第一字符作為第二字符。本申請提高了字符識別的準確性。
技術領域
本申請涉及識別技術領域,尤其涉及一種字符的確定方法、裝置、電子設置和可讀介質。
背景技術
OCR(Optical Character Recognition,光學字符識別)是指電子設備(例如掃描儀或數碼相機)檢查打印的字符,通過檢測暗、亮的模式確定其形狀,然后用字符識別方法將形狀翻譯成計算機文字的過程,可以應用于車牌識別,發票識別等。
當前的字符識別方法只考慮了單個字符,有可能會出現字符識別錯誤的情況,字符識別率準確度低。
發明內容
本申請實施例的目的在于提供一種字符的確定方法、裝置、電子設置和可讀介質,以解決字符識別率準確度低問題。具體技術方案如下:
第一方面,提供了一種字符的確定方法,所述方法包括:
將包含有第二字符的目標圖片輸入目標識別模型,得到所述目標識別模型識別出的第一字符的第一置信度,其中,所述第一置信度是所述第一字符為待預測的第二字符的概率;
將所述第二字符的上下文信息輸入語言預測模型,得到所述語言預測模型輸出的所述第一字符的第二置信度,其中,所述第二置信度為所述第一字符在所述上下文中為所述第二字符的概率;
根據所述第一置信度和所述第二置信度,得到所述第一字符為所述第二字符的待選置信度;
選取數值最大的待選置信度對應的第一字符作為所述第二字符。
可選地,在將包含有第二字符的目標圖片輸入目標識別模型之前,所述方法還包括:
將包含有多個第二字符的字符圖片按照字符形狀分割成多個單字符圖片,其中,每個單字符圖片上包括一個第二字符;
將所述單字符圖片進行縮放得到目標圖片,其中,所述目標圖片的尺寸與生成所述目標識別模型的樣本圖片的尺寸相同。
可選地,得到所述目標識別模型識別出的所述第一字符的第一置信度包括:
根據所述目標圖片的尺寸確定所述目標圖片的目標區域;
通過所述目標識別模型識別所述目標區域中各位置的圖像數據,其中,不同位置對應不同的所述圖像數據的權重信息;
通過各位置的圖像數據得到所述第一字符的第一置信度。
可選地,在得到所述目標識別模型識別出的所述第一字符的第一置信度之前,所述方法還包括:
將包含有第二字符的目標圖片輸入目標識別模型,得到所述目標識別模型輸出的所述第二字符對應的各候選字符的候選概率;
按照候選概率由大到小的排列順序,選取位于預設排位之前的候選概率對應的候選字符為所述第一字符。
可選地,將包含有第二字符的目標圖片輸入目標識別模型包括:
按照所述第二字符的排列順序,將所述目標圖片依次輸入所述目標識別模型。
可選地,在將包含有第二字符的目標圖片輸入目標識別模型之前,所述方法還包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京秒針人工智能科技有限公司,未經北京秒針人工智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110125543.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種適用于分類垃圾傾倒的垃圾處理裝置
- 下一篇:烘干室及干衣機





