[發(fā)明專利]一種文字檢測方法在審
| 申請?zhí)枺?/td> | 201711267804.8 | 申請日: | 2017-12-05 |
| 公開(公告)號: | CN108038486A | 公開(公告)日: | 2018-05-15 |
| 發(fā)明(設(shè)計)人: | 巫義銳;黃多輝;馮鈞 | 申請(專利權(quán))人: | 河海大學(xué) |
| 主分類號: | G06K9/34 | 分類號: | G06K9/34;G06K9/40;G06K9/46;G06N3/04;G06N3/08 |
| 代理公司: | 南京縱橫知識產(chǎn)權(quán)代理有限公司 32224 | 代理人: | 董建林 |
| 地址: | 211100 江蘇*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 文字 檢測 方法 | ||
本發(fā)明公開了一種文字檢測方法,該方法包括:提取待檢測文字圖片的極值區(qū)域,對極值區(qū)域進(jìn)行過濾,得到字符候選區(qū)域;計算MSSH特征、深度卷積特征,通過自編碼神經(jīng)網(wǎng)絡(luò)將MSSH特征、深度卷積特征融合,得到融合特征;根據(jù)融合特征進(jìn)一步從字符候選區(qū)域中篩選出字符區(qū)域;合并所有字符區(qū)域得到最終的文字區(qū)域。本發(fā)明檢測方法具有很強(qiáng)的魯棒性,檢測效率高,可以快速完成文字檢測任務(wù)。
技術(shù)領(lǐng)域
本發(fā)明涉及一種文字檢測方法。
背景技術(shù)
文字作為人類最具影響力的發(fā)明之一,在人類生活中發(fā)揮了重要作用。文字中所包含的豐富而精確的信息,對基于視覺語義的自然場景理解應(yīng)用具有重大意義。越來越多的多媒體應(yīng)用程序,例如街道場景理解,無人駕駛汽車對于交通標(biāo)識的理解和基于語義的圖像檢索等,均需要準(zhǔn)確而魯棒的文字檢測。文字檢測的基本任務(wù)在于確定場景圖像與視頻中是否存在文字,如果存在,則標(biāo)記它的位置。近年來,隨著圖像獲取設(shè)備能力和數(shù)量的增加,包含場景文字的圖像與視頻數(shù)量相較于過去急劇增加。因此,在自然場景圖像與視頻中進(jìn)行文字檢測已經(jīng)受到越來越多的關(guān)注。隨著計算機(jī)視覺相關(guān)技術(shù)的逐步深入研究,如何利用計算機(jī)算法進(jìn)行場景文字檢測已經(jīng)成為重要和活躍的國際性前沿課題之一。
低質(zhì)量和復(fù)雜背景的場景文字檢測與識別極具挑戰(zhàn)性。場景文字常具有分辨率低、復(fù)雜背景、任意方向、透視變形和光照不均勻等特性,而文檔文字擁有統(tǒng)一的格式與單一的背景。
發(fā)明內(nèi)容
本發(fā)明在于克服現(xiàn)有技術(shù)中的不足,提供一種文字檢測方法,解決現(xiàn)有技術(shù)中文字檢測成功率低、魯棒性不強(qiáng)的技術(shù)問題。
為解決上述技術(shù)問題,本發(fā)明所采用的技術(shù)方案是:一種文字檢測方法,該方法包括如下步驟:
提取待檢測文字圖片的極值區(qū)域,對極值區(qū)域進(jìn)行過濾,得到字符候選區(qū)域;
計算MSSH特征、深度卷積特征,通過自編碼神經(jīng)網(wǎng)絡(luò)將MSSH特征、深度卷積特征融合,得到融合特征;
根據(jù)融合特征進(jìn)一步從字符候選區(qū)域中篩選出字符區(qū)域;
合并所有字符區(qū)域得到最終的文字區(qū)域。
提取極值區(qū)域的具體方法如下:
將待檢測文字圖片轉(zhuǎn)化為灰度圖I
分別對I
R值圖I
其中I
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于河海大學(xué),未經(jīng)河海大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711267804.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





