[發(fā)明專利]一種圖像文字識別的方法和裝置有效
| 申請?zhí)枺?/td> | 201210279370.4 | 申請日: | 2012-08-07 |
| 公開(公告)號: | CN103577818B | 公開(公告)日: | 2018-09-04 |
| 發(fā)明(設計)人: | 韓鈞宇;丁二銳;吳中勤;文林福 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20 |
| 代理公司: | 北京鴻德海業(yè)知識產權代理事務所(普通合伙) 11412 | 代理人: | 袁媛 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 圖像 文字 識別 方法 裝置 | ||
1.一種圖像文字識別的方法,其特征在于,該方法包括:
S1、獲取待識別圖像中的文字區(qū)域;
S2、對文字區(qū)域中的各字塊分別進行識別并記錄各字塊的位置信息;
S3、基于各字塊的位置信息進行版面分析得到語句結構分布;
S41、將文字行中各字塊的識別結果與詞語庫進行匹配,得到構成詞語的識別結果;
S42、利用構成詞語的識別結果以及未構成詞語的識別結果按字塊順序進行組合得到各語句;
S43、確定各語句的語義置信度,或者進一步將各語句與語句數(shù)據(jù)庫進行匹配,依據(jù)匹配狀況確定各語句的匹配置信度;
S44、依據(jù)語句的語義置信度或總置信度,選擇語句作為校正后的識別結果,其中語句的總置信度由語句的語義置信度和匹配置信度結合確定。
2.根據(jù)權利要求1所述的方法,其特征在于,所述S1具體包括:
服務器接收移動終端發(fā)送來的待識別圖像,從所述待識別圖像中提取文字區(qū)域;或者,
服務器接收移動終端從待識別圖像中提取并發(fā)送來的文字區(qū)域。
3.根據(jù)權利要求1所述的方法,其特征在于,所述S3具體包括:
利用字塊中心在所述待識別圖像中的坐標信息將在豎直上位置差距小于預設第一閾值的字塊作為一個水平方向的文字行;或者,
利用字塊中心在所述待識別圖像中的坐標信息將在水平上位置差距小于預設第二閾值的字塊作為一個豎直方向的文字行;或者,
利用字塊中心在所述待識別圖像中的坐標信息將在豎直上位置差距小于預設第一閾值且字塊大小差異小于預設大小閾值的字塊作為一個水平方向的文字行;或者,
利用字塊中心在所述待識別圖像中的坐標信息將在水平上位置差距小于預設第二閾值且字塊大小差異小于預設大小閾值的字塊作為一個豎直方向的文字行。
4.根據(jù)權利要求1所述的方法,其特征在于,在所述S41中還包括:將文字行中非首位的字塊的識別結果中無法與緊鄰字塊的識別結果組成詞語的識別結果刪除,但對于可獨立成語義的或者緊鄰字塊的識別結果缺失的識別結果除外。
5.根據(jù)權利要求1所述的方法,其特征在于,所述S2中還包括:依據(jù)識別結果與圖片中字塊的相似度確定各字塊的識別結果的置信度;
在所述S43中利用語句中各識別結果的置信度求和得到語句的語義置信度,其中在求和時提高構成詞語的識別結果的置信度。
6.根據(jù)權利要求1所述的方法,其特征在于,所述S43中將各語句與語句數(shù)據(jù)庫進行匹配,依據(jù)匹配狀況確定各語句的匹配置信度具體包括:挑選語義置信度排在前n1個的語句,n1為預設的正整數(shù),將挑選的語句與語句數(shù)據(jù)庫進行匹配,依據(jù)匹配狀況確定各語句的匹配置信度。
7.根據(jù)權利要求1所述的方法,其特征在于,在所述S43中采用如下公式確定語句i的匹配置信度Cm:
Cm=Ni×α×Pi
其中,Ni為語句i包含的字數(shù),α為預設的系數(shù),Pi為語句i與語句L的最大連續(xù)匹配文字個數(shù)與語句L的總字數(shù)的比例,其中所述語句L為語句i在語句數(shù)據(jù)庫中的匹配語句。
8.根據(jù)權利要求1所述的方法,其特征在于,該方法還包括:
S5、利用校正后的識別結果進行搜索,確定與校正后的識別結果匹配狀況最優(yōu)的網絡文檔,截取該網絡文檔中與校正后的識別結果匹配的網絡文字內容作為擴展后的識別結果。
9.根據(jù)權利要求8所述的方法,其特征在于,所述截取該網絡文檔中與校正后的識別結果匹配的網絡文字內容作為擴展后的識別結果為:
從該網絡文檔中截取包含校正后的識別結果的最小句子或最小段落作為擴展后的識別結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210279370.4/1.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





