[發明專利]用于從成像文件提取文本的方法和設備有效
| 申請號: | 201610931615.5 | 申請日: | 2016-10-31 |
| 公開(公告)號: | CN107045632B | 公開(公告)日: | 2020-06-12 |
| 發明(設計)人: | 凱文·克強·鄧 | 申請(專利權)人: | 尼爾森(美國)有限公司 |
| 主分類號: | G06K9/32 | 分類號: | G06K9/32;G06K9/34;G06K9/62;G06K9/03 |
| 代理公司: | 北京同達信恒知識產權代理有限公司 11291 | 代理人: | 黃志華;何月華 |
| 地址: | 美國*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 成像 文件 提取 文本 方法 設備 | ||
1.一種用于從文件的圖像提取文本的方法,所述方法包括:
利用處理器將所述文件的所述圖像分段為對應于所述文件中的個體字符的局部子圖像;
利用所述處理器,通過如下方式確定所述子圖像中的第一子圖像與基準子圖像的視覺相關性:
將所述子圖像中的所述第一子圖像變換成具有對應于所述基準子圖像的空間取向以確定變換的子圖像;
在所述變換的子圖像周圍添加邊界;
針對所述基準子圖像相對于由所述邊界限定的分界線內的所述變換的子圖像的不同位置,計算所述變換的子圖像和所述基準子圖像之間的相關值;以及
將所述相關值中的最大相關值分配為所述子圖像中的所述第一子圖像與所述基準子圖像的所述視覺相關性;
利用所述處理器基于各自的所述子圖像與所述基準子圖像的相應的視覺相關性將所述各自的所述子圖像分組為群集,所述基準子圖像與被分組為所述群集的所述各自的所述子圖像之間的所述相應的視覺相關性超出相關性閾值;
利用所述處理器基于被分組為所述群集的所述子圖像識別用于所述群集的指定字符;以及
利用所述處理器將所述指定字符與所述文件的所述圖像中與被分組為所述群集的所述各自的所述子圖像相關聯的位置相關聯。
2.如權利要求1所述的方法,其中,識別所述指定字符而不使用光學字符識別引擎。
3.如權利要求1所述的方法,還包括通過如下方式識別用于所述群集的所述指定字符:
向人類檢查者呈現與所述群集相關聯的代表性子圖像;以及
接收來自所述人類檢查者的指示所述指定字符的反饋。
4.如權利要求1所述的方法,其中,基于與所述群集相關聯的代表性子圖像的光學字符識別來識別所述指定字符。
5.如權利要求4所述的方法,其中,所述代表性子圖像對應于被分組為所述群集的所述子圖像中的第一子圖像。
6.如權利要求4所述的方法,其中,所述代表性子圖像為被分組為所述群集的所述各自的所述子圖像的合成物。
7.如權利要求1和4至6中任一項所述的方法,還包括:
基于用于所述群集的代表性子圖像的光學字符識別分析的輸出來確定所述指定字符的可靠性;以及
當所述指定字符被確定為可靠時,自動地將所述指定字符分配給所述群集。
8.如權利要求7所述的方法,還包括:
當所述指定字符被確定為不可靠時,將所述代表性子圖像與存儲的子圖像相比較,所述存儲的子圖像與先前由人類檢查者驗證的存儲的指定字符相關聯;以及
當所述代表性子圖像與所述存儲的子圖像之間的視覺相關性超出所述相關性閾值時,自動地將所述存儲的指定字符分配為用于所述群集的所述指定字符。
9.如權利要求7所述的方法,還包括:當所述指定字符被確定為不可靠時,提示人類檢查者驗證所述指定字符。
10.如權利要求9所述的方法,其中,當通過所述光學字符識別分析生成的置信度值不滿足置信度閾值時,將所述指定字符確定為不可靠的。
11.如權利要求10所述的方法,其中,提示所述人類檢查者驗證所述指定字符包括:
當所述置信度值不滿足所述置信度閾值且滿足確認閾值時,在所述代表性子圖像旁邊顯示所述指定字符,以及請求所述人類檢查者確認所述指定字符對應于所述代表性子圖像;以及
當所述置信度值不滿足所述確認閾值時,顯示所述代表性子圖像以及請求所述人類檢查者識別所述代表性子圖像。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于尼爾森(美國)有限公司,未經尼爾森(美國)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610931615.5/1.html,轉載請聲明來源鉆瓜專利網。





