[發明專利]用于進行預定處理的設備及其控制方法和存儲介質有效
| 申請號: | 201810960050.2 | 申請日: | 2018-08-22 |
| 公開(公告)號: | CN109426817B | 公開(公告)日: | 2023-08-29 |
| 發明(設計)人: | 松本義高 | 申請(專利權)人: | 佳能株式會社 |
| 主分類號: | G06V30/16 | 分類號: | G06V30/16;G06V30/19;G06V30/14 |
| 代理公司: | 北京魏啟學律師事務所 11398 | 代理人: | 魏啟學 |
| 地址: | 日本東京都大*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 進行 預定 處理 設備 及其 控制 方法 存儲 介質 | ||
本發明提供一種用于進行預定處理的設備及其控制方法和存儲介質。在使用對掃描圖像進行OCR處理所獲得的字符串來設置文件名等的情形下,可以根據要掃描的字符串來設置適當的條件,以提高字符識別率。用于對掃描文檔所獲得的掃描圖像進行預定處理的設備包括:顯示控制單元,用于顯示用于進行預定處理的UI畫面,該UI畫面以能夠選擇的方式向用戶顯示掃描圖像中的被假定為一個連續字符串的字符區域;以及設置單元,用于基于用戶經由UI畫面選擇的字符區域的選擇順序和用于預定處理的補充信息的格式來確定用于OCR處理的條件,使用所確定的用于OCR處理的條件來對所選擇的字符區域進行OCR處理,并使用在OCR處理中提取的字符串來設置用于預定處理的補充信息。
技術領域
本發明涉及使用掃描圖像的字符識別結果并針對掃描圖像設置文件名等的技術。
背景技術
傳統上,掃描并數字化紙質文檔的方法已廣泛用作文檔管理方法。此外,在對文檔進行數字化時,存在一種對掃描圖像數據進行字符識別處理(OCR處理)并針對數字化后的文檔文件的文件名使用所識別的字符的技術。例如,日本特開2015-215878公開了如下技術,該技術將通過掃描原稿而獲得的掃描圖像呈現給用戶以指定區域,對所指定的區域進行OCR處理以獲得字符串,并針對掃描圖像的文件名使用該字符串。
在OCR處理中,根據預定條件設置,對掃描圖像中的一個連續字符串的每個區域(字符區域)進行用于提取字符串的處理。在這種情況下,在要應用的條件設置不適合于要掃描的各區域的情況下,可能增加誤識別的可能性?,F在,將描述具體示例。在圖1的示例中。在圖1中,與“Order?Form(訂購單)”,“Tokyo?Corporation(東京公司)”和“112014-90002”相對應的字符串的區域按此順序指定。用戶最初意圖在文件名輸入欄10中顯示(自動輸入)內容“OrderForm_TokyoCorporation_112014-90002”的字符串。然而,實際上,顯示“OrderForm_TokyoCorporation_H2014-9000Z”的內容,這是第三指定區域中的誤識別的結果。這是因為,在假設英語的情況下進行OCR處理的條件設置(即條件設置是用于識別字母和數字的OCR設置),因此第三指定區域包括一些噪聲。在這方面,在上述日本特開2015-215878中,可以對通過OCR處理所獲得的字符串進行通過使用鍵盤等的編輯操作(刪除和添加字符等)。然而,如果首先存在一種降低OCR處理中的誤識別概率的方法,則這種方法在提高用戶便利性方面是優越的。
已經作出本發明以解決上述問題,并且本發明的目的是在通過使用通過對掃描圖像進行OCR處理而獲得的字符串來設置文件名等的情形下,使得能夠根據要掃描的字符串來設置適當的條件并提高字符識別率。
發明內容
根據本發明,提供一種用于對通過掃描文檔所獲得的掃描圖像進行預定處理的設備,包括:顯示控制單元,其被配置為顯示用于進行所述預定處理的UI畫面,其中所述UI畫面以能夠選擇的方式向用戶顯示所述掃描圖像中的被假定為一個連續字符串的字符區域;以及設置單元,其被配置為基于用戶經由所述UI畫面所選擇的字符區域的選擇順序和用于所述預定處理的補充信息的格式來確定用于OCR處理的條件,通過使用所確定的用于OCR處理的條件來對所選擇的字符區域進行OCR處理,并且通過使用在所述OCR處理中提取的字符串來設置用于所述預定處理的補充信息。
根據本發明,提供一種用于對通過掃描文檔所獲得的掃描圖像進行預定處理的設備的控制方法,所述控制方法包括以下步驟:顯示用于進行所述預定處理的UI畫面,其中所述UI畫面以能夠選擇的方式向用戶顯示所述掃描圖像中的被假定為一個連續字符串的字符區域;以及基于用戶經由所述UI畫面所選擇的字符區域的選擇順序和用于所述預定處理的補充信息的格式來確定用于OCR處理的條件,通過使用所確定的用于OCR處理的條件來對所選擇的字符區域進行OCR處理,并且通過使用在所述OCR處理中提取的字符串來設置用于所述預定處理的補充信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于佳能株式會社,未經佳能株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810960050.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種票據區域旋轉和切分方法、系統、設備
- 下一篇:用于識別視線外對象的裝置





