[發明專利]一種判斷文檔主要文字方向的方法在審
| 申請號: | 202110867589.5 | 申請日: | 2021-07-28 |
| 公開(公告)號: | CN113673368A | 公開(公告)日: | 2021-11-19 |
| 發明(設計)人: | 魏舒;高翔;紀達麒;陳運文 | 申請(專利權)人: | 達而觀智能(深圳)有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/20;G06K9/62 |
| 代理公司: | 上海智力專利商標事務所(普通合伙) 31105 | 代理人: | 周濤 |
| 地址: | 518026 廣東省深圳市福田區福田街道*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 判斷 文檔 主要 文字 方向 方法 | ||
本發明公開了一種判斷文檔主要文字方向的方法,所述方法包括如下步驟:s1對文字圖像按照主要文字方向進行分類;s2基于分類結果旋轉文字圖像;s3對旋轉后的文字圖像做文字位置檢測;s4對檢測出的文字位置的文字圖像區域做文字識別;s5判斷文字識別結果的語義連貫程度;s6若語義連貫程度大于等于設定閾值,將識別結果輸出;s7若語義連貫程度低于設定閾值,對s3中檢測出的文字位置的文字圖像區域做180°翻轉后,針對翻轉后的文字圖像區域執行s4和s5的步驟,比較兩次得到的語義連貫程度,取其中較高的語義連貫程度對應的識別結果作為輸出。本發明彌補各個模塊的劣勢,以最低時間資源消耗提高文檔主要文字方向判斷的準確率。
技術領域
本發明屬于光學字符識別圖像預處理領域,具體涉及一種判斷文檔主要文字方向的方法。
背景技術
隨著大數據技術與人工智能技術的飛速發展,光學字符識別技術也得到了長足進步。光學字符識別技術在文檔信息智能提取、智能審核、比對等業務領域取得了廣泛的應用。基于大數據樣本與人工智能技術的基礎上,光學字符識別,特別是印刷體材料的光學字符識別,識別率已經非常接近于100%。
然而,在真正的工程應用領域或一些特定的場景下,會面對各種掃描、拍照等復雜場景,輸入文字圖像的方向可能出現旋轉90、180、270度的情況。所有的文字圖像正確識別的前提是確定待識別文字圖像的正方向,側向臥倒或倒立的文字很難正確識別。如何確定識別文字圖像的方向是圖像識別領域的關鍵問題。
目前常見的方法包括:
1.使用大量數據樣本訓練分類模型,直接輸入圖像,輸出4分類,判斷文檔方向為0度、90度、180度或270度。
2.首先使用文字檢測算法,得到所有的文字框,訓練針對字條的分類模型,再統計所有字條的分類結果,將最多的結果作為整個文字圖像的方向。
這兩個此方法都存在的問題是:1)需要大量各種場景的數據,準備數據的成本較高,并且數據場景是無法窮舉的,只要出現與訓練樣本不同場景的圖像,模型就可能無法正確分類;2)模型很難訓練到100%準確率,因為0度和180度,90度和270度,對于模型來說是很難準確區分的;3)文字圖像或文字字條都不一定只有一個方向的文字,更加增加了模型的訓練難度。
以上兩種方法在訓練數據、訓練模型、訓練方法都挑選得當的情況下,能較容易的達到95%以上的準確率,但是距離100%準確率還是有較大難度。
發明內容
針對現有技術中存在的問題,本發明提供一種判斷文檔主要文字方向的方法。
為實現上述目的,本發明采用以下技術方案:
一種判斷文檔主要文字方向的方法,所述方法包括如下步驟:s1對文字圖像按照主要文字方向進行分類;s2基于分類結果旋轉文字圖像;s3對旋轉后的文字圖像做文字位置檢測;s4對檢測出的文字位置的文字圖像區域做文字識別;s5判斷文字識別結果的語義連貫程度;s6若語義連貫程度大于等于設定閾值,將識別結果輸出;s7若語義連貫程度低于設定閾值,對s3中檢測出的文字位置的文字圖像區域做180°翻轉后,針對翻轉后的文字圖像區域執行s4和s5的步驟,比較兩次得到的語義連貫程度,取其中較高的語義連貫程度對應的識別結果作為輸出。
優選地,s1中對文字圖像按照主要文字方向進行分類之前,先將文字圖像做預處理。
優選地,所述預處理包括圖像尺寸統一和/或灰度化。
優選地,所述s5采用的判斷方法包括:常見字所占比例與統計概率的比較和/或詞性標注的規律和/或某個字的前后字是否常見。
一種計算機存儲介質,所述存儲介質中保存有計算機程序,所述計算機程序被執行時實現任一的判斷文檔主要文字方向的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于達而觀智能(深圳)有限公司,未經達而觀智能(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110867589.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:鋼管水壓試驗機
- 下一篇:一種輸電線路桿塔的塔基范圍內垂直接地系統





