[發(fā)明專利]圖像識別方法和裝置有效
| 申請?zhí)枺?/td> | 201610675805.5 | 申請日: | 2016-08-16 |
| 公開(公告)號: | CN106326888B | 公開(公告)日: | 2022-08-16 |
| 發(fā)明(設計)人: | 周舒暢;孫霏;姚聰;敖翔;周昕宇;何蔚然;印奇 | 申請(專利權)人: | 北京曠視科技有限公司;北京邁格威科技有限公司 |
| 主分類號: | G06V30/14 | 分類號: | G06V30/14;G06V30/146 |
| 代理公司: | 北京睿邦知識產(chǎn)權代理事務所(普通合伙) 11481 | 代理人: | 徐丁峰;戴亞南 |
| 地址: | 100190 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖像 識別 方法 裝置 | ||
本發(fā)明的實施例提供了一種圖像識別方法和裝置。該圖像識別方法包括:從待識別圖像中提取包含待識別對象的圖像塊;對圖像塊中的文字進行文字識別,以獲得初級識別結果;獲取描述文件,描述文件包括用于指示圖像塊中的文字需要符合的規(guī)則要求的約束信息;將圖像塊的坐標系與描述文件中規(guī)定的圖像坐標系對齊;以及利用描述文件中的至少部分約束信息對初級識別結果進行修正,以獲得最終識別結果。上述圖像識別方法和裝置,在從待識別圖像中識別文字信息時,利用獲取的描述文件修正文字識別結果,可以達到提高文字識別準確度和文字識別速度的效果。
技術領域
本發(fā)明涉及計算機領域,更具體地涉及一種圖像識別方法和裝置。
背景技術
在很多領域,需要對諸如身份證的證照或類似的具有一定文字排布規(guī)則的非證照對象中的文字進行識別。以證照為例,典型的證照識別流程是:用戶提供一張證照圖像,識別引擎從證照圖像中提取文字信息并輸出給用戶。
以上流程的缺陷在于:系統(tǒng)無法利用關于待識別證照的先驗知識,特別是關于各個域(包含文字的區(qū)域)的先驗知識來改進識別結果。例如按法律規(guī)定,中國居民身份證的背面的簽發(fā)機關只能是縣級公安機關。但是在現(xiàn)有流程中,無法將縣級公安機關的列表提供給識別引擎,從而無法利用這一信息。
發(fā)明內(nèi)容
考慮到上述問題而提出了本發(fā)明。本發(fā)明提供了一種圖像識別方法和裝置。
根據(jù)本發(fā)明一方面,提供了一種圖像識別方法,包括:從待識別圖像中提取包含待識別對象的圖像塊;對所述圖像塊中的文字進行文字識別,以獲得初級識別結果;獲取描述文件,所述描述文件包括用于指示所述圖像塊中的文字需要符合的規(guī)則要求的約束信息;將所述圖像塊的坐標系與所述描述文件中規(guī)定的圖像坐標系對齊;以及利用所述描述文件中的至少部分約束信息對所述初級識別結果進行修正,以獲得最終識別結果。
示例性地,在所述對所述圖像塊中的文字進行文字識別之后,所述圖像識別方法進一步包括:輸出所述初級識別結果,以供用戶查看。
示例性地,在所述利用所述描述文件中的至少部分約束信息對所述初級識別結果進行修正之前,所述圖像識別方法進一步包括:接收用戶修正指令;以及根據(jù)所述用戶修正指令從所述描述文件中選擇所述至少部分約束信息。
示例性地,在所述接收用戶修正指令之前,所述圖像識別方法進一步包括:提供關于所述描述文件中的所有約束信息的標識信息,以供用戶選擇,其中,所述用戶修正指令包括所述用戶輸入的、針對關于所述至少部分約束信息的標識信息的選擇指令。
示例性地,所述獲取描述文件包括:接收用戶輸入的初始文件;以及對所述初始文件進行解析,以獲得所述描述文件。
示例性地,在所述將所述圖像塊的坐標系與所述描述文件中規(guī)定的圖像坐標系對齊之前,所述圖像識別方法進一步包括:檢查所述描述文件是否存在格式錯誤,如果存在格式錯誤,則發(fā)出提醒信息。
示例性地,所述獲取描述文件包括:根據(jù)所述待識別對象的類別從預先存儲在存儲器中的描述文件集合中選擇所述描述文件。
示例性地,所述圖像塊中的文字分布于一個或多個域中,所述約束信息包括所述一個或多個域中的每一個的域名、坐標和屬性信息。
示例性地,所述屬性信息包括用于指向?qū)傩晕臋n的指示信息,所述屬性文檔包括其所對應的域中可能出現(xiàn)的所有文字。
示例性地,所述圖像識別方法還包括:接收用戶輸入的所述屬性文檔或獲取預先存儲在存儲器中的所述屬性文檔。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京曠視科技有限公司;北京邁格威科技有限公司,未經(jīng)北京曠視科技有限公司;北京邁格威科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610675805.5/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





