[發明專利]用于有助于檢測圖像內的文本的方法和裝置有效
| 申請號: | 201280057054.0 | 申請日: | 2012-10-08 |
| 公開(公告)號: | CN103946865B | 公開(公告)日: | 2017-03-29 |
| 發明(設計)人: | V·帕拉梅斯瓦蘭;S-H·特賽;R·格澤茨克祖克 | 申請(專利權)人: | 諾基亞技術有限公司 |
| 主分類號: | G06K9/32 | 分類號: | G06K9/32;G06K9/00;G06K9/20;G06K9/34;G06K9/46 |
| 代理公司: | 北京市金杜律師事務所11256 | 代理人: | 酆迅 |
| 地址: | 芬蘭*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 有助于 檢測 圖像 文本 方法 裝置 | ||
技術領域
本發明的實施例總體涉及圖像處理技術并且更具體地涉及用于有助于檢測圖像內的文本的方法和裝置。
背景技術
現代計算時代已經帶來計算能力的迅速擴張從而產生可負擔并且強大的計算設備的發展。現代計算設備的使用已經變得在跨社會經濟背景范疇的消費者之中幾乎無處不在。這些現代計算設備可以能夠執行多種基于圖像的服務、例如包括增強現實應用、興趣點導航服務和/或其它應用,在這些其它應用中,可以捕獲用戶的周圍環境的圖像并且用可以通過處理圖像而獲得的附加情境信息擴充圖像。作為又一示例,三維地圖繪制技術可以使用捕獲的現實圖像以產生三維地圖,這些三維地圖包括可以從圖像情境獲得的與興趣點有關的三維定位信息和內容。
這樣的基于圖像的服務可以依賴于檢測捕獲的現實圖像內的文本和/或通過該檢測來增強。就此而言,在現實圖像內識別的文本可以用來有助于興趣點識別、提供捕獲的文本的音頻回讀、為異國旅行者提供語言翻譯服務等。然而圖像內的文本檢測仍然成問題。就此而言,盡管已經在文檔識別領域內使用圖像中的文本檢測,但是在自然界圖像(比如室外場景中的文本檢測)已經證實由于如下挑戰而明顯更困難,這些挑戰由于大量文本字體和樣式、相機視點、圖像對比度以及其它因素而產生,這些其它因素影響捕獲的自然界圖像內的文本的可視性。另外,盡管文檔文本在文檔識別領域中可以是在捕獲的圖像內的主要焦點,但是在自然界圖像內的文本覆蓋范圍通常是圖像的很小部分(經常在數十兆像素的圖像中占用數百像素)。
發明內容
這里提供用于有助于在圖像內的文本檢測的方法、裝置和計算機程序產品。根據各種實施例的方法、裝置和計算機程序產品可以向計算設備、計算設備用戶和設備服務提供商提供若干優點。更具體而言,一些示例實施例提供檢測圖像中的文本,這可以特別有益于檢測在自然界圖像(比如室外圖像)內的文本,在該自然界圖像中可能存在多種字體樣式和大小,并且在該自然界圖像中,背景對比度可能另外妨礙文本檢測。就此而言,一些示例實施例提供在自然界圖像內獨立于文本的字體、字母樣式、語言和定向的文本檢測。更具體而言,一些示例實施例利用可以獨立于字體、字母樣式和語言的文本性質,這些性質可以通過使用可以基于理解的文本性質的模型而更迅速執行的計算來提供比先前方法更快的文本檢測。另外,一些示例實施例所提供的基于模型的文本檢測方式可以比先前基于試探的方式更可靠。一些示例實施例還提供用于為文本檢測指定性能界限的能力,從而可以根據可以由文本模型定義的已知文本性質來提供某個檢測率、由此使用戶能夠調節文本檢測以滿足希望的性能界限。
在第一示例實施例中,提供一種方法,該方法可以包括計算與包含假設的文本片段的圖像區域關聯的阿爾法值。阿爾法值可以被定義為用于假設的文本片段的彎曲字符長度分布、字符寬度分布和字符間間距分布的函數。這一示例實施例的方法還可以包括至少部分地基于針對假設的文本片段確定的間隔長度分布計算伽馬值。這一示例實施例的方法也可以包括至少部分地基于計算出的阿爾法值和伽馬值對圖像區域是否為包含文本的區域進行分類。
在另一示例實施例中,提供了一種裝置。這一示例實施例的裝置可以包括至少一個處理器和存儲計算機程序代碼的至少一個存儲器。至少一個存儲器和存儲的計算機程序代碼可以被配置為與至少一個處理器一起使這一示例實施例的裝置至少計算與包含假設的文本片段的圖像區域關聯的阿爾法值。阿爾法值可以被定義為用于假設的文本片段的彎曲字符長度分布、字符寬度分布和字符間間距分布的函數。至少一個存儲器和存儲的計算機程序代碼可以被配置為與至少一個處理器一起還使這一示例實施例的裝置至少部分地基于針對假設的文本片段確定的間隔長度分布計算伽馬值。至少一個存儲器和存儲的計算機程序代碼可以被配置為與至少一個處理器一起還使這一示例實施例的裝置至少部分地基于計算出的阿爾法值和伽馬值對圖像區域是否為包含文本的區域進行分類。
在另一示例實施例中,提供了一種計算機程序產品。這一實施例的計算機程序產品包括至少一個計算機可讀存儲介質,至少一個計算機可讀存儲介質具有在其中存儲的計算機可讀程序指令。這一示例實施例的程序指令可以包括被配置為計算與包含假設的文本片段的圖像區域關聯的阿爾法值的程序指令。阿爾法值可以被定義為用于假設的文本片段的彎曲字符長度分布、字符寬度分布和字符間間距分布的函數。這一示例實施例的程序指令還可以包括被配置為至少部分地基于針對假設的文本片段確定的間隔長度分布計算伽馬值的程序指令。這一示例實施例的程序指令可以包括被配置為至少部分地基于計算出的阿爾法值和伽馬值對圖像區域是否為包含文本的區域進行分類的程序指令。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于諾基亞技術有限公司,未經諾基亞技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201280057054.0/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





