[發明專利]手機拍照翻譯裝置無效
| 申請號: | 200710043540.8 | 申請日: | 2007-07-06 |
| 公開(公告)號: | CN101339617A | 公開(公告)日: | 2009-01-07 |
| 發明(設計)人: | 楊健 | 申請(專利權)人: | 上海思必得通訊技術有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06K9/38;H04M3/487 |
| 代理公司: | 上海智信專利代理有限公司 | 代理人: | 薛琦 |
| 地址: | 201700上海*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 手機 拍照 翻譯 裝置 | ||
技術領域
本發明涉及數字圖像處理領域、模式識別領域、及嵌入式設備領域,特別涉及一種手持設備拍照翻譯設備。
背景技術
隨著手持設備的發展和普及,手機已經越來越成為人們日常生活隨身攜帶的電子設備,而如何將需要翻譯的資料高效輸入,并將資料及時翻譯,為手機功能提供新的發展機遇。
發明內容
本發明的目的是提供一種拍照翻譯裝置。
本發明的目的是通過以下技術方案實現的:
一種拍照翻譯裝置,包括:
字符特征圖像識別(OCR)引擎單元,用于將文字資料數字圖像中的字符轉換成字符標準內碼。
一個翻譯引擎單元,用于翻譯OCR識別出來的文字資料;
一個至少具有130萬像素并具有微距功能的拍攝單元,用于拍攝獲取名片的數字圖像;
一個圖像預處理單元,用于將拍攝的圖像轉換成翻譯引擎單元所能識別的圖像格式,將圖像進行二值化壓縮,用于提升識別速度;
一個用戶界面單元,用于與用戶交互,向導用戶使用該功能界面。
其中,該OCR引擎單元包括:
引擎庫單元,用于存儲字符特征向量;
引擎設置單元,用于設置運行模式或數字圖像參數;
引擎啟動單元,用于分配運行空間、將引擎庫裝載入內存,啟動引擎為可執行狀態;
引擎版面分析單元,用于劃分版面,分割翻譯單詞區域,將可識別字符用連通區域框定;
引擎識別單元,用于識別連通區內的數字圖像,根據數字圖像直觀形象提取特征進行識別,輸出字符內碼;以及
引擎關閉單元,釋放內存空間,關閉引擎。
該引擎庫單元包括:
翻譯庫單元,用于存放詞與翻譯內容的對照表;以及
翻譯接口單元,用于提供輸入翻譯字,獲取翻譯結果的接口。
圖像預處理單元:從照相設備單元獲取數字圖像,該圖像分辨率在1280×960以上,Jpg圖像經過硬件解碼轉為16位rgb圖像,從16位rgb圖像轉化為8位灰度bmp格式圖像,然后對圖像進行二值化處理;
二值圖像是指整幅圖像畫面內僅黑(灰度值為0)白(灰度值為1)二值的圖像,在它們上面不呈現出灰度的變化。在數字圖像處理中,二值圖像占有非常重要的地位。這是因為在實用的圖像處理系統中,要求處理的速度高、成本低,信息量大的濃淡圖像處理花銷太大,不是上策。而且二值化后的圖像能夠用幾何學中的概念進行分析和特征描述,比起灰度圖像來說方便得多。因而二值圖像處理目前已成為圖像處理中的一個獨立的、重要分支而獲得廣泛的應用。
設表示像素在(i,j)位置的灰度值,二值化處理為下式所示。
這里t為二值化閾值(Threshold)。像素的8-鄰域(8-Neighbor),除去d-近鄰的像素外,余下的對角線上的4個像素,稱為(i,j)的非直接鄰域,符號是:i-近鄰。某個像素的連接數可以用這個像素的8-鄰域值f(x0)…f(x7)來計算。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海思必得通訊技術有限公司,未經上海思必得通訊技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200710043540.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:微型多路電氣火災監控報警器
- 下一篇:一種應用系統間數據同步的方法和裝置





