[發明專利]一種圖像中的字符提取方法及裝置在審
| 申請號: | 201210513036.0 | 申請日: | 2012-12-04 |
| 公開(公告)號: | CN103854024A | 公開(公告)日: | 2014-06-11 |
| 發明(設計)人: | 黃樹東;金遠 | 申請(專利權)人: | 百度國際科技(深圳)有限公司 |
| 主分類號: | G06K9/46 | 分類號: | G06K9/46 |
| 代理公司: | 北京鴻德海業知識產權代理事務所(普通合伙) 11412 | 代理人: | 倪志華 |
| 地址: | 518057 廣東省深圳市南山*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 圖像 中的 字符 提取 方法 裝置 | ||
技術領域
本發明涉及信息處理領域,特別是涉及一種圖像中的字符提取方法及裝置。
背景技術
隨著移動終端(智能手機、平板電腦等)的快速發展及普及,基于多媒體信息的搜索需求越來越大。目前,基于輸入內容的不同,上述搜索主要分為:文本搜索、語音搜索、圖像直接搜索以及圖像光學識別(OCR)搜索。圖像OCR搜索針對前三種搜索的局限性,通過對圖像中的字符塊進行提取,并進行OCR識別轉換為文本在進行搜索,其可以對網頁、軟件界面、視頻、攝影預覽、照片中出現的文字進行搜索,無需用戶進行打字輸入,給用戶帶來了極大的便利。
然而,如何根據用戶的選擇快速提取圖像中的字符是上述搜索方式急需解決的問題。傳統的從圖像中提取字符的方法是通過設置一可邊框來實現,用戶通過調整可變框的位置及大小來對圖像中的特定字符進行框選及提取。這種方式存在操作繁瑣、誤選率高(特別是對小屏幕移動終端)、靈活性差等問題,嚴重影響了用戶體驗。
發明內容
本發明主要解決的技術問題是提供一種圖像中的字符提取方法及裝置,以使用戶方便、快速且準確地從圖像中提取字符。
為解決上述技術問題,本發明采用的一個技術方案是:提供一種圖像中的字符提取方法,包括:獲取字符圖像,字符圖像包括背景以及與背景相互區別的至少一字符行,字符行包括沿行方向排列的多個字符;獲取第一坐標;在第一坐標處設置沿行方向延伸的檢測線,并沿列方向平移檢測線,以確定字符行的列邊緣;根據字符行的列邊緣從字符圖像中切分出包括目標字符行的行區域;沿行方向確定目標字符行中的字符的行邊緣之間的間隙;根據行邊緣之間的間隙將行區域切分成多個塊區域,每一塊區域包括至少一字符。
其中,獲取字符圖像的步驟包括:獲取彩色圖像;對彩色圖像進行灰度化處理,以獲得灰度圖像;對灰度圖像進行二值化處理,以獲得字符圖像,其中背景由第一顏色表示,字符行由第二顏色表示。
其中,獲取字符圖像的步驟與獲取第一坐標的步驟之間進一步包括:利用一半透明掩膜覆蓋字符圖像。
其中,于第一坐標處設置沿行方向延伸的檢測線,并沿列方向平移檢測線,以確定字符行的列邊緣的步驟包括:在第一坐標處設置沿行方向延伸的第一檢測線和第二檢測線,并沿列方向反向平移第一檢測線和第二檢測線。
其中,于第一坐標處設置沿行方向延伸的檢測線,并沿列方向平移檢測線,以確定字符行的列邊緣的步驟包括:根據檢測線與字符行的接觸點數量確定字符行的列邊緣。
其中,根據字符行的列邊緣從字符圖像中切分出包括目標字符行的行區域的步驟包括:根據目標字符行的兩側列邊緣以及目標字符行的相鄰字符行的相鄰列邊緣或預先設定的平移閾值確定行區域的兩側列邊緣在列方向上的位置。
其中,沿行方向確定目標字符行中的字符的行邊緣之間的間隙的步驟包括:沿行方向確定目標字符行中的字符之間的詞間隙和字符間隙,其中詞間隙大于字符間隙;根據行邊緣之間的間隙將行區域切分成多個塊區域的步驟包括:根據詞間隙將行區域切分成多個塊區域。
其中,字符提取方法進一步包括:對塊區域進行緩存。
其中,字符提取方法進一步包括:獲取第二坐標;選取第一坐標和第二坐標之間的虛擬連線上的點所落入的塊區域。
其中,獲取第一坐標的步驟與于第一坐標處設置沿行方向延伸的檢測線,并沿列方向平移檢測線,以確定字符行的列邊緣的步驟之間進一步包括:判斷是否存在第一坐標對應的已緩存的塊區域,若存在,則進入獲取第二坐標的步驟,若不存在,則進入于第一坐標處設置沿行方向延伸的檢測線,并沿列方向平移檢測線,以確定字符行的列邊緣的步驟。
其中,字符提取方法進一步包括:發送選取的塊區域至第三方應用,以對選取的塊區域中的字符進行識別。
其中,發送選取的塊區域至第三方應用的步驟進一步包括:顯示選取的塊區域飛出字符圖像的動畫效果。
為解決上述技術問題,本發明采用的另一個技術方案是:提供一種圖像中的字符提取裝置,包括:字符圖像獲取單元,用于獲取字符圖像,字符圖像包括背景以及與背景相互區別的至少一字符行,字符行包括沿行方向排列的多個字符;第一坐標獲取單元,用于獲取第一坐標;列邊緣檢測單元,用于在第一坐標處設置沿行方向延伸的檢測線,并沿列方向平移檢測線,以確定字符行的列邊緣;行區域切分單元,用于根據字符行的列邊緣從字符圖像中切分出包括目標字符行的行區域;行邊緣檢測單元,用于沿行方向確定目標字符行中的字符的行邊緣之間的間隙;塊區域切分單元,用于根據行邊緣之間的間隙將行區域切分成多個塊區域,每一塊區域包括至少一字符。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度國際科技(深圳)有限公司,未經百度國際科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210513036.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種具有標準接口的浮箱
- 下一篇:驅動單元及電動輔助自行車
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





