[發明專利]文本識別方法及裝置在審
| 申請號: | 202111101994.2 | 申請日: | 2021-09-18 |
| 公開(公告)號: | CN113780229A | 公開(公告)日: | 2021-12-10 |
| 發明(設計)人: | 徐支勇;李長亮 | 申請(專利權)人: | 北京金山數字娛樂科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/20;G06K9/32;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京智信禾專利代理有限公司 11637 | 代理人: | 劉曉楠 |
| 地址: | 100085 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 識別 方法 裝置 | ||
本申請提供文本識別方法及裝置,其中所述文本識別方法包括:獲取待識別文本;將所述待識別文本輸入至識別模塊進行處理,獲得所述待識別文本中目標字符,以及所述目標字符對應的文本框;建立所述目標字符與所述文本框的位置關系,并根據所述位置關系生成所述待識別文本對應的目標文本。
技術領域
本申請涉及人工智能技術領域,特別涉及一種文本識別方法。本申請同時涉及一種文本識別裝置、一種計算設備,以及一種計算機可讀存儲介質。
背景技術
隨著互聯網技術的發展,文本識別功能成為了大多數業務場景中不可缺少的一項技術,如拍照搜題場景,檔案錄入場景,紙質信息電子化場景,文檔格式轉換場景等,都會涉及到文本識別技術。而文本識別的精準度在各個業務場景中都顯得尤為重要。現有技術中,在文檔格式轉換場景中,針對文本識別需求大多數采用OCR識別技術;然而隨著對識別精準度的需求提高,OCR識別技術很難滿足大多數場景的識別精準度需求,因此亟需一種有效的方案以解決上述問題。
發明內容
有鑒于此,本申請實施例提供了一種文本識別方法,以解決現有技術中存在的技術缺陷。本申請實施例同時提供了一種文本識別裝置,一種計算設備,以及一種計算機可讀存儲介質。
根據本申請實施例的第一方面,提供了一種文本識別方法,包括:
獲取待識別文本;
將所述待識別文本輸入至識別模塊進行處理,獲得所述待識別文本中目標字符,以及所述目標字符對應的文本框;
建立所述目標字符與所述文本框的位置關系,并根據所述位置關系生成所述待識別文本對應的目標文本。
可選地,所述將所述待識別文本輸入至識別模塊進行處理,獲得所述待識別文本中目標字符,包括:
將所述待識別文本輸入至所述識別模塊,通過所述識別模塊中的字符識別單元進行處理獲得初始字符以及所述初始字符對應的字符坐標;
計算所述字符坐標之間的坐標相似度,根據計算結果篩選目標字符坐標;
基于所述目標字符坐標在所述初始字符中篩選出所述目標字符,并通過所述識別模塊輸出。
可選地,所述將所述待識別文本輸入至識別模塊進行處理,獲得所述目標字符對應的文本框,包括:
將所述待識別文本輸入至所述識別模塊,通過所述識別模塊中的文本處理單元進行處理獲得文本圖片以及所述文本圖片對應的尺寸信息;
檢測所述文本圖片中包含的文本組成元素,并基于所述尺寸信息創建所述文本組成元素對應的文本框;
將所述文本組成元素對應的文本框作為所述目標字符對應的文本框,并通過所述識別模塊輸出。
可選地,所述文本組成元素包括下述至少一項:頁眉、頁腳、文本行;
相應的,所述基于所述尺寸信息創建所述文本組成元素對應的文本框,包括:
基于所述尺寸信息確定所述頁眉對應的頁眉坐標、所述頁腳對應的頁腳坐標,以及所述文本行對應的文本行坐標;
根據所述頁眉坐標創建頁眉文本框、根據所述頁腳坐標創建頁腳文本框,以及根據所述文本行坐標創建文本行文本框;
將所述頁眉文本框、所述頁腳文本框以及所述文本行文本框作為所述文本組成元素對應的文本框。
可選地,所述建立所述目標字符與所述文本框的位置關系步驟執行之前,還包括:
確定所述目標字符對應的字符坐標信息以及所述文本框對應的文本框坐標信息;
相應的,所述建立所述目標字符與所述文本框的位置關系,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京金山數字娛樂科技有限公司,未經北京金山數字娛樂科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111101994.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種羅漢果酒的釀制方法
- 下一篇:一種石墨烯護腰及其制備方法





