[發明專利]一種識別作文稿紙的手寫文本識別并復現文本結構的方法在審
| 申請號: | 202111551666.2 | 申請日: | 2021-12-17 |
| 公開(公告)號: | CN114241492A | 公開(公告)日: | 2022-03-25 |
| 發明(設計)人: | 黎旭民;麥永欽;林超純;張秀屏;羅彥卓;董祖蘭;陳栩杰;藍文輝;張博 | 申請(專利權)人: | 黑盒科技(廣州)有限公司 |
| 主分類號: | G06V30/40 | 分類號: | G06V30/40;G06V20/62;G06V10/774;G06V30/19;G06V10/44;G06V10/26;G06V30/148;G06V10/762;G06V10/764;G06V10/30;G06V10/56 |
| 代理公司: | 深圳市創富知識產權代理有限公司 44367 | 代理人: | 侯騰騰 |
| 地址: | 511458 廣東省廣州市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 識別 作文 稿紙 手寫 文本 復現 結構 方法 | ||
本發明公開了一種識別作文稿紙的手寫文本識別并復現文本結構的方法,包括:使用拍攝設備拍取一頁手寫作文圖片,初步進行調整;對圖片進行特定預處理操作,將原始圖片進行文本矯正,得到待識別的圖片;將待識別的圖片利用使用特定數據集進行訓練的文字檢測算法模型檢測每一行的手寫文本區域,同時獲取每一個文本區域在圖像中位置信息;對于檢測到的每一行文本區域,使用特定數據集進行訓練的文本識別算法模型快速識別出手寫的文本內容;結合文本區域在圖像中位置信息和文本內容信息進行分析,從而還原真實的作文文本內容和結構。利用該方法可以精確快速識別出待識別目標的真實文本內容,用于后續的NLP相關操作,從而對作文進行批改。
技術領域
本發明涉及文本識別技術領域,尤其涉及一種識別作文稿紙的手寫文本識別并復現文本結構的方法。
背景技術
對于日益成熟的人工智能技術應用,目前,智能閱卷技術也發展越來越好,這也得益于手寫字體識別領域發展以及識別能達到很高的精度。同時針對特殊的垂直領域的手寫字體識別通用的OCR并不能滿足要求,都需要對該垂直領域的數據進行一系列特殊的操作,從而達到真實內容數字化。
針對閱卷中重要的一部分:作文的文本識別,主要是對手寫字體的識別,但同時中文作文通用的寫作稿紙是帶有格子信息的,英文作文的通用的寫作稿紙是帶有橫線的,格子以及橫線等干擾信息影響著文本識別的精度。目前大部分技術是對格子等干擾信息進行去除,即對原始圖片進行特殊的預處理操作進行手寫文本與干擾信息的分離,再進行文本的識別,此方法大大變慢了識別速度以及一定程度對文本位置特征進行了修改,不利于后續內容的復現。本領域的現有技術存在以下缺陷:
(1)現有OCR識別技術主要針對打印文本的檢測和識別,精度可以達到非常高,而對于手寫文本的識別效果差強人意,而且手寫的文本過于多樣,傳統OCR識別在該垂直領域效果較差,有效提高手寫識別精度。
(2)對預測圖片需要進行過多的預處理操作,既需要去掉格子或橫線來提高精度,能夠大大降低識別速度。通過深度學習的泛化能力,即使針對基于格子、非貼合文本、橫線等干擾項,進行文本識別
(3)現有OCR服務調用接口都是對文本進行識別,偏向于通用識別,而對于手寫作文識別領域的識別后的內容不做文本特征結構分析,識別出文本不能作為復現的真實內容和整體結構。
發明內容
有鑒于現有技術的上述缺陷,本發明所要解決的技術問題是提供一種識別作文稿紙的手寫文本識別并復現文本結構的方法,該方法對移動設備拍攝的手寫作文稿紙圖片進行帶格子和橫線干擾信息的端到端文本識別,即不經過對原圖片進行特征預處理而識別出文本,同時通過文本位置的特征信息進行文本分析歸類,從而復現真實的作文內容。利用該方法可以精確快速識別出待識別目標的真實文本內容,用于后續的NLP相關操作,從而對作文進行批改。
為實現上述目的,本發明提供了一種識別作文稿紙的手寫文本識別并復現文本結構的方法,包括以下步驟:
步驟1:使用拍攝設備拍取一頁手寫作文圖片,初步進行調整;
步驟2:對圖片進行特定預處理操作,將原始圖片進行文本矯正,得到待識別的圖片;
步驟3:將待識別的圖片利用使用特定數據集進行訓練的文字檢測算法模型檢測每一行的手寫文本區域,同時獲取每一個文本區域在圖像中位置信息;
步驟4:對于檢測到的每一行文本區域,使用特定數據集進行訓練的文本識別算法模型快速識別出手寫的文本內容;
步驟5:結合步驟3與步驟4文本區域在圖像中位置信息和文本內容信息進行分析,從而還原真實的作文文本內容和結構。
進一步的,所述步驟1拍攝的作文圖片局限于中文的作文和英文的作文,作文的稿紙包括但不限于格子、橫線、白紙的稿紙模板。
進一步的,所述步驟2對圖片進行特定預處理操作,將原始圖片進行文本矯正,具體為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于黑盒科技(廣州)有限公司,未經黑盒科技(廣州)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111551666.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一株圓紅球菌噬菌體P19及其應用
- 下一篇:一種閘閥用注蠟模具





