[發明專利]一種掃描文檔信息處理方法、裝置、電子設備及存儲介質在審
| 申請號: | 202110254868.4 | 申請日: | 2021-03-09 |
| 公開(公告)號: | CN112949514A | 公開(公告)日: | 2021-06-11 |
| 發明(設計)人: | 廖林濤;朱增 | 申請(專利權)人: | 廣州文石信息科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/32;G06K9/34;G06K9/40;G06F40/106;G06F40/109 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 許慶勝 |
| 地址: | 510000 廣東省廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 掃描 文檔 信息處理 方法 裝置 電子設備 存儲 介質 | ||
1.一種掃描文檔信息處理方法,其特征在于,包括:
獲取掃描文檔;所述掃描文檔中包括多個字符;
對所述掃描文檔進行文字識別,得到每個所述字符的文字信息和位置信息;
計算所述文字信息的文字置信度和所述位置信息的位置置信度;
根據所述文字置信度和所述位置置信度確定可信字符;
采用所述可信字符的文字信息和位置信息渲染所述掃描文檔,得到渲染文檔;
顯示所述渲染文檔。
2.根據權利要求1所述的方法,其特征在于,所述掃描文檔包括至少一個待識別頁面;所述對所述掃描文檔進行文字識別,得到每個所述字符的文字信息和位置信息的步驟,包括:
對所述待識別頁面進行渲染,得到渲染圖像;
對所述渲染圖像進行預處理,得到預處理圖像;
對所述預處理圖像進行灰度化處理,得到灰度圖像;
對所述灰度圖像進行二值化處理,得到二值化圖像;
去除所述二值化圖像的噪聲,得到去噪圖像;
對所述去噪圖像進行傾斜校正處理,得到校正圖像;
對所述校正圖像進行版面分析和字符切割,得到每個所述字符的位置信息;
對切割得到的每個所述字符進行文字識別,得到文字信息。
3.根據權利要求2所述的方法,其特征在于,所述根據所述文字置信度和所述位置置信度確定可信字符的步驟,包括:
判斷所述文字置信度是否大于第一預設閾值,且所述位置置信度是否大于第二預設閾值;
若是,將所述字符確定為可信字符。
4.根據權利要求3所述的方法,其特征在于,所述采用所述可信字符的文字信息和位置信息渲染所述掃描文檔,得到渲染文檔的步驟,包括:
根據所述可信字符的位置信息,在所述掃描文檔的待識別頁面上繪制所述文字信息,生成渲染頁面;
采用所有所述渲染頁面生成渲染文檔。
5.根據權利要求4所述的方法,其特征在于,所述顯示所述渲染文檔的步驟之后,還包括:
當檢測到用戶針對所述渲染文檔上的目標字符觸發的文字操作時,響應所述文字操作,提取所述目標字符對應的目標文字信息和目標位置信息;
顯示所述目標文字信息和所述目標位置信息。
6.一種掃描文檔信息處理裝置,其特征在于,包括:
掃描文檔獲取模塊,用于獲取掃描文檔;所述掃描文檔中包括多個字符;
文字識別模塊,用于對所述掃描文檔進行文字識別,得到每個所述字符的文字信息和位置信息;
置信度計算模塊,用于計算所述文字信息的文字置信度和所述位置信息的位置置信度;
可信字符確定模塊,用于根據所述文字置信度和所述位置置信度確定可信字符;
渲染文檔生成模塊,用于采用所述可信字符的文字信息和位置信息渲染所述掃描文檔,得到渲染文檔;
顯示模塊,用于顯示所述渲染文檔。
7.根據權利要求6所述的裝置,其特征在于,所述掃描文檔包括至少一個待識別頁面;所述文字識別模塊,包括:
渲染子模塊,用于對所述待識別頁面進行渲染,得到渲染圖像;
預處理子模塊,用于對所述渲染圖像進行預處理,得到預處理圖像;
灰度化處理子模塊,用于對所述預處理圖像進行灰度化處理,得到灰度圖像;
二值化處理子模塊,用于對所述灰度圖像進行二值化處理,得到二值化圖像;
去噪子模塊,用于去除所述二值化圖像的噪聲,得到去噪圖像;
傾斜校正子模塊,用于對所述去噪圖像進行傾斜校正處理,得到校正圖像;
位置信息獲取子模塊,用于對所述校正圖像進行版面分析和字符切割,得到每個所述字符的位置信息;
文字識別子模塊,用于對切割得到的每個所述字符進行文字識別,得到文字信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州文石信息科技有限公司,未經廣州文石信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110254868.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種升降桌架
- 下一篇:一種雙驅動可折疊共軸螺旋槳裝置





