[發明專利]一種圖像切分標記方法及其裝置在審
| 申請號: | 201611163078.0 | 申請日: | 2016-12-15 |
| 公開(公告)號: | CN108229454A | 公開(公告)日: | 2018-06-29 |
| 發明(設計)人: | 興百橋;熊蜀光;周迅溢;楊鏡;白建國 | 申請(專利權)人: | 北京新唐思創教育科技有限公司 |
| 主分類號: | G06K9/03 | 分類號: | G06K9/03;G06K9/20 |
| 代理公司: | 北京合智同創知識產權代理有限公司 11545 | 代理人: | 李杰 |
| 地址: | 100144 北京市石景山區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖像 整體標記 錯誤標記 工作效率 人力消耗 自動標記 申請 | ||
本申請實施例提供一種圖像切分標記方法及其裝置,所述方法,包括:對需要進行OCR識別的圖像進行整體自動標記,獲得整體標記圖像;對所述整體標記圖像進行附加標記,調整所述整體標記圖像中的錯誤標記。本申請實施例能夠對圖像自動切分標記,減少人力消耗,提高了工作效率。
技術領域
本申請屬于圖像識別技術領域,具體涉及一種圖像切分標記方法及其裝置。
背景技術
OCR(Optical Character Recognition,光學字符識別)是指電子設備(例如掃描儀或數碼相機)檢查紙上打印的字符,通過檢測暗、亮的模式確定其形狀,然后用字符識別方法將形狀翻譯成計算機文字的過程;即,針對印刷體字符,采用光學的方式將紙質文檔中的文字轉換成為黑白點陣的圖像文件,并通過識別軟件將圖像中的文字轉換成文本格式,供文字處理軟件進一步編輯加工的技術。如何除錯或利用輔助信息提高識別正確率,是OCR最重要的課題,ICR(Intelligent Character Recognition)的名詞也因此而產生。衡量一個OCR系統性能好壞的主要指標有:拒識率、誤識率、識別速度、用戶界面的友好性,產品的穩定性,易用性及可行性等。
在OCR識別中,圖像切分質量的好壞,直接影響OCR的識別率。對一個切錯的圖像進行OCR識別時,往往無法得到正確的識別結果。為了提升圖像切分的準確率,需要獲得當前切分算法的準確率,要計算當前切分算法的準確率,則需要將當前切分的結果與正確切分的答案進行對比。制作正確切分答案時通常使用人工進行手工標注,既耗費人力,工作效率也不高。
因此,如何實現對圖像切分標記,成為現有技術中亟需解決的技術問題。
發明內容
本申請實施例解決的技術問題之一在于提供一種圖像切分標記方法及其裝置,其能夠對圖像自動切分標記,減少人力消耗,提高了工作效率。
本申請實施例提供一種圖像切分標記方法,包括:
對需要進行OCR識別的圖像進行整體自動標記,獲得整體標記圖像;
對所述整體標記圖像進行附加標記,調整所述整體標記圖像中的錯誤標記。
在本申請具體實現中,所述對需要進行OCR識別的圖像進行整體自動標記,獲得整體標記圖像包括:
獲得所述需要進行OCR識別的圖像的所有連通域;
對所述所有連通域進行分析與處理,得到整體標記圖像。
在本申請具體實現中,所述對所述所有連通域進行分析與處理,得到整體標記圖像包括:
刪除大于和小于寬、高閾值的連通域;和/或,
合并有交集的連通域,或者上下連通域,或者左右連通域。
在本申請具體實現中,所述對所述整體標記圖像進行附加標記,調整所述整體標記圖像中的錯誤標記包括:
對所述整體標記圖像進行一標多的附加標記,將錯誤標記的多個區塊合并為一個區塊。
在本申請具體實現中,所述對所述整體標記圖像進行附加標記,調整所述整體標記圖像中的錯誤標記還包括:
對所述整體標記圖像進行多標一的附加標記,將錯誤標記的一個區塊拆分為多個區塊。
在本申請具體實現中,所述對所述整體標記圖像進行附加標記,調整所述整體標記圖像中的錯誤標記還包括:
對所述整體標記圖像進行未標記的附加標記,采取自動或者手動方式對未標記區塊進行標記。
在本申請具體實現中,所述對所述整體標記圖像進行附加標記,調整所述整體標記圖像中的錯誤標記還包括:
對所述整體標記圖像進行標噪音的附加標記,對噪音區塊進行刪除。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京新唐思創教育科技有限公司,未經北京新唐思創教育科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611163078.0/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





