[發明專利]縱向校對方法和裝置無效
| 申請號: | 201010195279.5 | 申請日: | 2010-05-31 |
| 公開(公告)號: | CN102262614A | 公開(公告)日: | 2011-11-30 |
| 發明(設計)人: | 王琛;劉正珍 | 申請(專利權)人: | 漢王科技股份有限公司 |
| 主分類號: | G06F17/21 | 分類號: | G06F17/21;G06K9/20;G06K9/62 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100193 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 縱向 校對 方法 裝置 | ||
技術領域
本發明屬于文字處理領域,涉及一種數據校對的方法和裝置,具體涉及一種縱向校對方法和裝置。
背景技術
一個完整的文檔錄入系統分為以下部分:紙質資料的整理、掃描、圖像預處理、版面分析、識別、校對和保存,其中校對又可以分為橫向校對和縱向校對兩部分。
橫向校對:這是傳統的人工校對方法,直接將識別結果文本與圖像進行對比,系統自動調用文本所對應的圖像進行比對,同時,以顏色標記識別可信度不高的文字。
縱向校對:將文檔中識別結果為同一個字的文字圖像集中顯示,并以突出顏色標出可疑字,發現錯誤并修改,具有很強的查錯能力。
縱向校對將文檔中所有識別結果相同的字符圖像集中呈現在一個視圖中,從而使校對人員較容易挑出其中錯誤的字符。但是一般來說,需要糾正的字符是由于字形相近引起,如“大”和“犬”字形相近,所以在這些字形相近的字符中尋找差異的字符。如果做大量這樣的工作的話,容易引起視覺疲勞,造成校對的準確率降低。
發明內容
本發明所要解決的技術問題是提出一種縱向校對方法和裝置,將對于文檔中識別成同一字符的圖像進行聚類,得到聚類形成的類別,并且按類別對字符圖像進行分類的顯示,然后再進行字符的校對。校對的準確率比一般的縱向校對方法的準確率要高,減輕校對人員的疲勞程度。
本發明公開了一種縱向校對方法,包括以下步驟:
步驟1:將輸入的文本通過OCR識別引擎進行識別,并記錄每個字符在圖像中的位置;
步驟2:對識別成同一識別結果的字符圖像使用聚類的方法進行圖像分類;
步驟3:根據圖像分類所形成的類別將字符進行分類顯示;
步驟4:根據分類顯示的結果進行校對。
所述步驟1中記錄每個字符在圖像中的位置時,記錄各字符對應的字符圖像在原圖中的外接矩形框的坐標。
所述步驟2包括以下幾個步驟:
步驟2.1:對對識別成同一識別結果的字符圖像進行特征提取,提取字符圖像的字形特征;
步驟2.2:根據字符圖像的字形特征進行聚類,將字符圖像進行分類,得到不同的字符圖像的類別。
所述步驟2.2中,對字符圖像的類別采用聚類索引列表對字符圖像進行索引。
所述步驟3中分類顯示時,分別顯示每一類別所包括的字符圖像。
所述步驟3中分類顯示時,按照各個類別所包含圖像的數目分別顯示各類別的字符圖像。
所述步驟4中根據分類顯示的結果進行校對時,將該分類中聚類索引列表中的每個字符圖像的識別結果分別修改為目標字符。
所述步驟4中根據分類顯示的結果進行校對時,對該分類中聚類索引列表中的每個字符圖像的識別結果均修改為同一個目標字符。
本發明還公開了一種縱向校對裝置,包括以下模塊:
識別模塊:將輸入的文本通過OCR識別引擎進行識別,并記錄每個字符在圖像中的位置;
分類模塊:對識別成同一識別結果的字符圖像使用聚類的方法進行圖像分類;
顯示模塊:根據圖像分類所形成的類別將字符進行分類顯示;
校正模塊:根據分類顯示的結果進行校對。
本發明一種改進的縱向校對方法和裝置的優點在于:在縱向校對加入了聚類的步驟,對于文檔中識別成同一字符的圖像進行聚類,得到聚類形成的類別,并且按類別對字符圖像進行分類的顯示,然后再進行字符的校對。使錯誤的字符和正確的字符被分在不同的類別中被分類顯示,可以很容易將正確的字符圖像和錯誤的字符圖像區分開來,校對的準確率比一般的縱向校對方法的準確率要高,減輕校對人員的疲勞程度。
附圖說明
圖1為本發明縱向校對方法的流程圖;
圖2為本發明縱向校對方法在聚類前顯示狀態圖;
圖3為本發明縱向校對方法在聚類后顯示狀態圖;
圖4為本發明縱向校對方法的聚類示意圖;
圖5為本發明縱向校對方法聚類的數據結構示意圖。
具體實施方式
為使本發明的上述目的、特征和優點能夠更加明顯易懂,下面結合附圖和具體實施方式對本發明作進一步詳細的說明。
本發明公開了一種縱向校對方法,如圖1所示,包括如下步驟:
步驟1:將輸入的文本通過OCR識別引擎進行字符識別,并記錄每個字符在圖像中的位置;
采用OCR識別引擎對輸入的文本進行識別,并且記錄每個字符在圖像中的位置,本實施例中,在內存中記錄各字符對應的字符圖像在原圖中的外接矩形框的坐標。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于漢王科技股份有限公司,未經漢王科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010195279.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種數據庫存儲數據的方法及裝置
- 下一篇:移動終端及其內存泄露檢測方法





