[發明專利]一種文本識別方法、裝置、設備及存儲介質有效
| 申請號: | 201910509640.8 | 申請日: | 2019-06-13 |
| 公開(公告)號: | CN110245606B | 公開(公告)日: | 2021-07-20 |
| 發明(設計)人: | 董勇軍;秦偉 | 申請(專利權)人: | 廣東小天才科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/34;G06K9/62 |
| 代理公司: | 深圳青年人專利商標代理有限公司 44350 | 代理人: | 劉杰 |
| 地址: | 523000 廣東省東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 文本 識別 方法 裝置 設備 存儲 介質 | ||
1.一種文本識別方法,其特征在于,所述方法包括下述步驟:
檢測預設的文本識別觸發事件;
當檢測到所述文本識別觸發事件時,獲取待進行文本識別的目標圖像;
通過光學字符識別算法獲取所述目標圖像中的文本數據;
通過預設的帶權重字符串匹配算法,將獲取到的所述文本數據與預先獲取的目標書本數據進行匹配,獲得文本匹配結果;
根據所述文本匹配結果,輸出與所述目標圖像中文本對應的最佳匹配文本;
獲取待進行文本識別的目標圖像的步驟之后,通過光學字符識別算法獲取所述目標圖像中的文本數據的步驟之前,所述方法還包括:
根據所述目標圖像,獲取待進行文本識別的焦點文本;
通過光學字符識別算法獲取所述目標圖像中的文本數據的步驟之后,將獲取到的所述文本數據與預先獲取的目標書本數據進行匹配的步驟之前,所述方法還包括:
根據所述焦點文本和所述文本數據中的所有行文本,對用戶意愿的待識別句子進行預測;
將獲取到的所述文本數據與預先獲取的目標書本數據進行匹配的步驟,包括:
將所述文本數據中的單字符與所述目標書本數據中的單字符進行相似度匹配,獲得第一相似度匹配結果;
將所述用戶意愿的待識別句子和所述目標書本數據包含的句子內容文本列表中所有句子進行相似度匹配,獲得第二相似度匹配結果;
根據所述文本匹配結果,輸出與所述目標圖像中文本對應的最佳匹配文本的步驟,包括:
根據所述第一相似度匹配結果、所述第二相似度匹配結果,并結合所述用戶意愿的待識別句子的上下文信息,獲得與所述目標圖像中文本對應的所述最佳匹配文本,并輸出所述最佳匹配文本。
2.如權利要求1所述的方法,其特征在于,獲取待進行文本識別的目標圖像的步驟,包括:
通過智能筆中攝像頭對所述攝像頭當前焦距所對應的、待進行文本識別的文本區域進行拍照,獲得所述文本區域對應的目標圖像;
根據所述目標圖像,獲取待進行文本識別的焦點文本的步驟,包括:
獲取所述攝像頭當前焦點在所述目標圖像中的相對焦點坐標;
根據所述相對焦點坐標獲取所述當前焦點在所述目標圖像中對應的焦點文本。
3.如權利要求1所述的方法,其特征在于,對用戶意愿的待識別句子進行預測的步驟,包括:
將所述文本數據中的所有行文本與所述目標書本數據包含的句子內容文本列表中所有句子進行比較,根據比較結果和所述目標書本數據包含的單詞在句子中的排版行號對所述焦點文本進行拼接,得到所述用戶意愿的待識別句子。
4.一種文本識別裝置,其特征在于,所述裝置包括:
觸發事件檢測單元,用于檢測預設的文本識別觸發事件;
目標圖像獲得單元,用于當檢測到所述文本識別觸發事件時,獲取待進行文本識別的目標圖像;
文本數據獲取單元,用于通過光學字符識別算法獲取所述目標圖像中的文本數據;
匹配結果獲得單元,用于通過預設的帶權重字符串匹配算法,將獲取到的所述文本數據與預先獲取的目標書本數據進行匹配,獲得文本匹配結果;以及
匹配文本輸出單元,用于根據所述文本匹配結果,輸出與所述目標圖像中文本對應的最佳匹配文本;
所述裝置還包括:
焦點文本獲取單元,用于根據所述目標圖像,獲取待進行文本識別的焦點文本;
句子預測單元,用于根據所述焦點文本和所述文本數據中的所有行文本,對用戶意愿的待識別句子進行預測;
所述匹配結果獲得單元包括:
第一結果獲得單元,用于將所述文本數據中的單字符與所述目標書本數據中的單字符進行相似度匹配,獲得第一相似度匹配結果;以及
第二結果獲得單元,用于將所述用戶意愿的待識別句子和所述目標書本數據包含的句子內容文本列表中所有句子進行相似度匹配,獲得第二相似度匹配結果;
所述匹配文本輸出單元包括:
文本輸出子單元,用于根據所述第一相似度匹配結果、所述第二相似度匹配結果,并結合所述用戶意愿的待識別句子的上下文信息,獲得與所述目標圖像中文本對應的所述最佳匹配文本,并輸出所述最佳匹配文本。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東小天才科技有限公司,未經廣東小天才科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910509640.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:基于手背靜脈身份識別的社區矯正穿戴設備
- 下一篇:眼球追蹤方法及相關產品





