[發(fā)明專利]信息處理設(shè)備、信息處理設(shè)備的控制方法和存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 201611237042.2 | 申請日: | 2016-12-28 |
| 公開(公告)號: | CN107085699B | 公開(公告)日: | 2021-06-15 |
| 發(fā)明(設(shè)計(jì))人: | 七海嘉仁 | 申請(專利權(quán))人: | 佳能株式會社 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/20;H04N1/00 |
| 代理公司: | 北京魏啟學(xué)律師事務(wù)所 11398 | 代理人: | 魏啟學(xué) |
| 地址: | 日本東京都大*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 信息處理 設(shè)備 控制 方法 存儲 介質(zhì) | ||
本發(fā)明涉及信息處理設(shè)備、信息處理設(shè)備的控制方法和存儲介質(zhì)。該信息處理設(shè)備包括:提取單元,用于提取整體圖像的特征量和局部圖像的特征量;決定單元,用于基于所述整體圖像的特征量和所述局部圖像的特征量來決定所述局部圖像在所述整體圖像中的位置;接收單元,用于接收對所述局部圖像中所包括的對象的選擇;以及轉(zhuǎn)換單元,用于將基于所決定的所述局部圖像在所述整體圖像中的位置,來將在所述局部圖像中的所選擇的對象的坐標(biāo)轉(zhuǎn)換成所述整體圖像中的坐標(biāo)。
技術(shù)領(lǐng)域
本發(fā)明涉及信息處理設(shè)備、信息處理設(shè)備的控制方法和存儲介質(zhì)。
背景技術(shù)
近年來,具有照相機(jī)的移動終端已經(jīng)普及。在現(xiàn)有技術(shù)中,用戶已經(jīng)使用掃描器等來對紙質(zhì)文檔進(jìn)行電子拍攝,而如今能夠通過使用移動終端的照相機(jī)等來簡單地對紙質(zhì)文檔進(jìn)行電子拍攝。日本特開2011-008802公開了用于對通過使用照相機(jī)所拍攝的圖像進(jìn)行OCR的技術(shù)。
發(fā)明內(nèi)容
為了使用OCR所識別出的文本信息,OCR精度是非常重要的。然而,存在如下可能性:與接近對象時所拍攝的商業(yè)名片或駕駛執(zhí)照的OCR精度相比,諸如A4或A3等的相對大尺寸的紙質(zhì)文檔的OCR精度可能降低。更具體地,除了相對于對象的距離遠(yuǎn)所引起的所要識別的文本中的各單個字符的分辨率降低之外,在對圖像細(xì)節(jié)進(jìn)行聚焦時還可能發(fā)生模糊。因此,即使在諸如A4或A3等的相對大尺寸的紙質(zhì)文檔中,也必須在接近對象的文本區(qū)域時拍攝圖像,以提高OCR精度。利用提高了的OCR精度,可以通過在拍攝了紙質(zhì)文檔的整體圖像之后,在接近要使用的文本區(qū)域時拍攝圖像,來獲取紙質(zhì)文檔的整體圖像和具有良好精度的文本信息。
本發(fā)明提供在接近紙質(zhì)文檔時拍攝圖像的情況下能夠快速地找到所需的文本區(qū)域的信息處理設(shè)備。
本發(fā)明的一種信息處理設(shè)備,其特征在于,包括:提取單元,用于提取整體圖像的特征量和局部圖像的特征量;決定單元,用于基于所述整體圖像的特征量和所述局部圖像的特征量來決定所述局部圖像在所述整體圖像中的位置;接收單元,用于接收對所述局部圖像中所包括的對象的選擇;以及轉(zhuǎn)換單元,用于基于所決定的所述局部圖像在所述整體圖像中的位置,來將所述局部圖像中的所選擇的對象的坐標(biāo)轉(zhuǎn)換成所述整體圖像中的坐標(biāo)。
本發(fā)明的一種信息處理設(shè)備的控制方法,所述控制方法的特征在于包括以下步驟:提取步驟,用于提取整體圖像的特征量和局部圖像的特征量;決定步驟,用于基于所述整體圖像的特征量和所述局部圖像的特征量來決定所述局部圖像在所述整體圖像中的位置;接收步驟,用于接收對所述局部圖像中所包括的對象的選擇;以及轉(zhuǎn)換步驟,用于基于所決定的所述局部圖像在所述整體圖像中的位置,來將所述局部圖像中的所選擇的對象的坐標(biāo)轉(zhuǎn)換成所述整體圖像中的坐標(biāo)。
本發(fā)明的一種非瞬態(tài)存儲介質(zhì),其存儲使計(jì)算機(jī)執(zhí)行信息處理設(shè)備的控制方法的計(jì)算機(jī)程序,其特征在于,所述控制方法包括:提取步驟,用于提取整體圖像的特征量和局部圖像的特征量;決定步驟,用于基于所述整體圖像的特征量和所述局部圖像的特征量來決定所述局部圖像在所述整體圖像中的位置;接收步驟,用于接收對所述局部圖像中所包括的對象的選擇;以及轉(zhuǎn)換步驟,用于基于所決定的所述局部圖像在所述整體圖像中的位置,來將所述局部圖像中的所選擇的對象的坐標(biāo)轉(zhuǎn)換成所述整體圖像中的坐標(biāo)。
根據(jù)本發(fā)明,可以提供在通過接近紙質(zhì)文檔來拍攝圖像的情況下能夠找到所需的文本區(qū)域的信息處理設(shè)備。
通過以下(參考附圖)對典型實(shí)施例的說明,本發(fā)明的其它特征將變得明顯。
附圖說明
圖1是示出移動終端的外觀的示例的圖。
圖2是示出移動終端的硬件結(jié)構(gòu)的示例的圖。
圖3是示出移動終端的軟件結(jié)構(gòu)的示例的圖。
圖4是示出移動應(yīng)用程序的UI的示例的圖。
圖5是示出整體圖像和局部圖像的示例的圖。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于佳能株式會社,未經(jīng)佳能株式會社許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611237042.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 傳感設(shè)備、檢索設(shè)備和中繼設(shè)備
- 簽名設(shè)備、檢驗(yàn)設(shè)備、驗(yàn)證設(shè)備、加密設(shè)備及解密設(shè)備
- 色彩調(diào)整設(shè)備、顯示設(shè)備、打印設(shè)備、圖像處理設(shè)備
- 驅(qū)動設(shè)備、定影設(shè)備和成像設(shè)備
- 發(fā)送設(shè)備、中繼設(shè)備和接收設(shè)備
- 定點(diǎn)設(shè)備、接口設(shè)備和顯示設(shè)備
- 傳輸設(shè)備、DP源設(shè)備、接收設(shè)備以及DP接受設(shè)備
- 設(shè)備綁定方法、設(shè)備、終端設(shè)備以及網(wǎng)絡(luò)側(cè)設(shè)備
- 設(shè)備、主設(shè)備及從設(shè)備
- 設(shè)備向設(shè)備轉(zhuǎn)發(fā)





