[發(fā)明專利]圖像文字區(qū)域的識別方法、電視機和可讀存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 201711468194.8 | 申請日: | 2017-12-27 |
| 公開(公告)號: | CN107977658B | 公開(公告)日: | 2021-09-28 |
| 發(fā)明(設(shè)計)人: | 陳銘良;賴長明;吳佳飛 | 申請(專利權(quán))人: | 深圳TCL新技術(shù)有限公司 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20 |
| 代理公司: | 深圳市世紀(jì)恒程知識產(chǎn)權(quán)代理事務(wù)所 44287 | 代理人: | 宋朝政 |
| 地址: | 518052 廣東省深圳市南山區(qū)中*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 圖像 文字 區(qū)域 識別 方法 電視機 可讀 存儲 介質(zhì) | ||
本發(fā)明公開了一種圖像文字區(qū)域的識別方法,圖像文字區(qū)域的識別方法包括以下步驟:對待識別圖像進(jìn)行處理得到含有多個最大穩(wěn)定極值區(qū)域的第一待處理二值圖像;聚合各個所述最大穩(wěn)定極值區(qū)域以獲得多個備選框,并將所述第一待處理二值圖像作為所述待識別圖像的掩膜以獲得第二待處理二值圖像;刪除所述第二待處理二值圖像的所述最大穩(wěn)定極值區(qū)域中的非文本區(qū)域;將所述備選框添加至刪除操作后的所述第二待處理二值圖像,并將含有所述最大穩(wěn)定極值區(qū)域的所述備選框作為文字區(qū)域。本發(fā)明還公開了一種電視機和可讀存儲介質(zhì)。本發(fā)明提高了圖像文字區(qū)域的識別精度。
技術(shù)領(lǐng)域
本發(fā)明涉及圖像處理技術(shù)領(lǐng)域,尤其涉及一種圖像文字區(qū)域的識別方法、電視機和可讀存儲介質(zhì)。
背景技術(shù)
文字區(qū)域檢測和定位是一個非常重要的基礎(chǔ)性計算機視覺技術(shù),它是光學(xué)字符識別的前提。
自然場景下的文字區(qū)域檢測由于受到光照,文字變形和尺度變換等問題的挑戰(zhàn),傳統(tǒng)的文字檢測算法無法正確檢測到相應(yīng)的文字區(qū)域,即現(xiàn)有技術(shù)中圖像文字區(qū)域的識別精度低。
發(fā)明內(nèi)容
本發(fā)明的主要目的在于提供一種圖像文字區(qū)域的識別方法、電視機和可讀存儲介質(zhì),旨在解決圖像文字區(qū)域的識別精度低的問題。
為實現(xiàn)上述目的,本發(fā)明提供一種圖像文字區(qū)域的識別方法,所述圖像文字區(qū)域的識別方法包括以下步驟:
對待識別圖像進(jìn)行處理得到含有多個最大穩(wěn)定極值區(qū)域的第一待處理二值圖像;
聚合各個所述最大穩(wěn)定極值區(qū)域以獲得多個備選框,并將所述第一待處理二值圖像作為所述待識別圖像的掩膜以獲得第二待處理二值圖像;
刪除所述第二待處理二值圖像的所述最大穩(wěn)定極值區(qū)域中的非文本區(qū)域;
將所述備選框添加至刪除操作后的所述第二待處理二值圖像,并將含有所述最大穩(wěn)定極值區(qū)域的所述備選框作為文字區(qū)域。
優(yōu)選地,所述刪除所述第二待處理二值圖像的所述最大穩(wěn)定極值區(qū)域中的非文本區(qū)域的步驟包括:
采用卷積神經(jīng)網(wǎng)絡(luò)算法判斷所述第二待處理二值圖像的所述最大穩(wěn)定極值區(qū)域是否為非文本區(qū)域;
刪除判定為非文本區(qū)域的所述最大穩(wěn)定極值區(qū)域。
優(yōu)選地,所述對待識別圖像進(jìn)行處理得到含有多個最大穩(wěn)定極值區(qū)域的第一待處理二值圖像的步驟之后,還包括:
獲取所述第一待處理二值圖像中各個所述最大穩(wěn)定極值區(qū)域的幾何信息,并判斷所述幾何信息是否匹配預(yù)設(shè)幾何信息;
刪除不匹配的所述幾何信息對應(yīng)的所述最大穩(wěn)定極值區(qū)域,并并執(zhí)行所述聚合各個所述最大穩(wěn)定極值區(qū)域以獲得多個備選框的步驟。
優(yōu)選地,所述對待識別圖像進(jìn)行處理得到含有多個最大穩(wěn)定極值區(qū)域的第一待處理二值圖像的步驟包括:
采用依次遞增的灰度閾值二值化處理所述待識別圖像,以獲得含有多個最大穩(wěn)定極值區(qū)域的第一待處理二值圖像。
優(yōu)選地,所述聚合各個所述最大穩(wěn)定極值區(qū)域以獲得多個備選框的步驟包括:
獲取所述最大穩(wěn)定極值區(qū)域?qū)?yīng)的預(yù)設(shè)膨脹參數(shù);
根據(jù)所述預(yù)設(shè)膨脹參數(shù)對各個所述最大穩(wěn)定極值區(qū)域進(jìn)行膨脹操作,以獲得待處理區(qū)域;
將交疊的各個所述待處理區(qū)域聚合,以獲得所述備選框。
優(yōu)選地,所述圖像文字區(qū)域的識別方法,還包括:
獲取所述待識別圖像的格式;
在所述待識別圖像的格式為預(yù)設(shè)格式時,執(zhí)行所述對待識別圖像進(jìn)行處理得到含有多個最大穩(wěn)定極值區(qū)域的第一待處理二值圖像的步驟;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳TCL新技術(shù)有限公司,未經(jīng)深圳TCL新技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711468194.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





