[發明專利]智能移動終端場景文字處理方法有效
| 申請號: | 201410581464.6 | 申請日: | 2014-10-27 |
| 公開(公告)號: | CN104408449B | 公開(公告)日: | 2018-01-30 |
| 發明(設計)人: | 盧朝陽;李靜;劉曉佩;姜維;通天意;汪文芳 | 申請(專利權)人: | 西安電子科技大學寧波信息技術研究院 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20 |
| 代理公司: | 寧波誠源專利事務所有限公司33102 | 代理人: | 鄧青玲 |
| 地址: | 315200 浙江省寧波市鎮*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 智能 移動 終端 場景 文字處理 方法 | ||
技術領域
本發明涉及模式識別中的文字模式識別領域,具體地涉及智能移動終端場景文字處理方法,用于對智能移動終端拍攝的場景文字進行識別。
背景技術
隨著信息技術的迅速發展,模式識別在很多科技領域得到了廣泛的應用和重視,如人工智能、醫學、神經生物學、武器制造、導航等領域。在這些領域中,常見的應用有指紋識別、人臉識別、光學字符識別、文字識別、精確制導、故障檢測、語音識別和翻譯等。模式識別技術的高速發展和廣泛應用,極大地促進了國民經濟建設和國防科技現代化建設。
文字處理是模式識別領域的一個重要分支。現實世界中,人們離不開文字,自然場景文字的處理一直是模式識別中的熱點問題之一。自從上世紀90年代以來,國際文檔分析與識別會議(International Conference of Document Analysis and Recognition,ICDAR)每隔兩年舉行一次,極大地促進了文字處理技術的發展。
隨著移動智能終端的普及與發展,智能手機以其獨有的便捷和智能越來越得到人們的鐘愛。在日常生活中,人們看到自己感興趣的文字,可以隨時利用自己的手機拍攝成圖片,然后提取其中的文字信息,這樣會免去人們手寫輸入的麻煩,使人們的生活更加便捷。同時,移動終端上的文字處理還可以應用于其他多種領域,例如識別街道的路牌,結合GPS定位,可以給盲人導航;識別汽車牌照,可以更加方便交警管理和記錄信息;提取商店門牌的文字信息并翻譯成使用者熟悉的語言,可以方便他們在國外的旅行等。因此,在智能手機上進行文字處理有極大的應用前景。
然而,在智能手機上實現上述應用存在較大的技術挑戰,主要體現在如下兩方面:一方面,自然場景中文字的多樣性和不確定性使得對自然場景中的文字處理變得異常困難;另一方面,智能手機的CPU、GPU的限制,對文字處理方法的準確度和實時性提出了更高的要求。
綜上,自然場景文字處理一直是圖像識別領域的一個難點,尤其是在智能手機上進行文字處理,開展基于智能手機上的場景文字處理研究對人工智能的發展具有實際意義,對我國的信息化建設也具有重要作用。
發明內容
本發明所要解決的技術問題是針對上述現有技術提供一種智能移動終端場景文字處理方法,該方法兼顧了速度和準確率,適合在移動平臺中使用。
本發明解決上述技術問題所采用的技術方案為:一種智能移動終端場景文字處理方法,其特征在于:包括如下步驟:
步驟1:基于邊緣的文本粗檢測,具體包括:
(1-1)、采用彩色圖像邊緣檢測方法對智能移動終端內的輸入場景圖像I進行邊緣檢測,得到第一中間處理圖像;
(1-2)、對第一中間處理圖像進行形態學運算,連接第一中間處理圖像中的斷裂文字以及相鄰的文字,得到第二中間處理圖像;
(1-3)、通過尋找連通域的方法對第二中間處理圖像進行處理,從而獲得輸入場景圖像I的候選文本區域集合S;
步驟2、獲取輸入場景圖像I的筆畫寬度圖T,對候選文本區域集合S中的每個候選文本區域進行筆畫寬度和幾何特征分析,剔除不符合要求的非文本區域,最后輸出定位結果圖L1;
步驟3、識別預處理,具體包括:
(3-1)、對定位結果圖L1的文本區域進行對比度增強;
(3-2)、對增強后的文本區域進行中值濾波;
(3-3)、對中值濾波后的文本區域進行二值化;
(3-4)、對二值化后的文本區域進行字符切分;
步驟4、對切分后的單字符進行規范化和方向線素特征的提取操作,具體包括:
(4-1)、對切分后的每個字符進行裁剪,去掉字符周圍的白色背景,對剪裁后的每幅字符圖像采用雙線性插值法將其尺寸統一變換為N×N;
(4-2)、提取統一尺寸后單個字符的輪廓,并計算其方向線素特征;
(4-3)、采用距離分類器對每個字符進行識別,得到每個字符最接近的X個字符;
步驟5、基于Gabor特征的細分類,具體包括:
(5-1)、將每個字符采用雙線性插值法將其尺寸統一變換為M×M。
(5-2)、對統一尺寸后的字符進行Gabor變換,提取Gabor特征;
(5-3)、在(4-3)識別后得到每個字符最接近的X個字符的基礎上,利用距離分類器再次進行識別,得出每個字符的識別結果。
作為改進,所述步驟2具體包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安電子科技大學寧波信息技術研究院,未經西安電子科技大學寧波信息技術研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410581464.6/2.html,轉載請聲明來源鉆瓜專利網。





