[發(fā)明專利]基于筆畫寬度變換與卷積神經(jīng)網(wǎng)絡(luò)的場(chǎng)景文本檢測(cè)方法有效
| 申請(qǐng)?zhí)枺?/td> | 201811021712.6 | 申請(qǐng)日: | 2018-09-03 |
| 公開(公告)號(hào): | CN109117841B | 公開(公告)日: | 2020-12-11 |
| 發(fā)明(設(shè)計(jì))人: | 肖蘋蘋;柯志達(dá);林春敏;彭振文;蘇亮;陳衛(wèi)強(qiáng);周方明 | 申請(qǐng)(專利權(quán))人: | 廈門金龍聯(lián)合汽車工業(yè)有限公司 |
| 主分類號(hào): | G06K9/32 | 分類號(hào): | G06K9/32;G06K9/34 |
| 代理公司: | 泉州市博一專利事務(wù)所(普通合伙) 35213 | 代理人: | 方傳榜 |
| 地址: | 361023 *** | 國(guó)省代碼: | 福建;35 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 筆畫 寬度 變換 卷積 神經(jīng)網(wǎng)絡(luò) 場(chǎng)景 文本 檢測(cè) 方法 | ||
本發(fā)明公開了一種基于筆畫寬度變換與卷積神經(jīng)網(wǎng)絡(luò)的場(chǎng)景文本檢測(cè)方法,涉及場(chǎng)景文本檢測(cè)領(lǐng)域,包括以下步驟:準(zhǔn)備訓(xùn)練數(shù)據(jù)集,通過卷積神經(jīng)網(wǎng)絡(luò)基于Bootstrap策略訓(xùn)練文本二分類器;利用最大穩(wěn)定極值區(qū)域算法從圖像中獲得候選文本區(qū)域;利用所述文本二分類器對(duì)所述候選文本區(qū)域進(jìn)行分類;在候選文本區(qū)域中,基于筆畫寬度變換算法獲得候選字符,通過幾何約束過濾候選字符。本發(fā)明的有益效果:本方法基于Bootstrap策略的訓(xùn)練豐富了樣本圖像的數(shù)量與質(zhì)量;利用筆畫寬度變換算法基于確定的候選文本區(qū)域提高了檢測(cè)性能,并將檢測(cè)級(jí)別確定為字符級(jí);基于區(qū)域的算法以及大量中文訓(xùn)練樣本使得方法有效地檢測(cè)出中文文本。
技術(shù)領(lǐng)域
本發(fā)明涉及場(chǎng)景文本檢測(cè)領(lǐng)域,尤其是指一種基于筆畫寬度變換與卷積神經(jīng)網(wǎng)絡(luò)的場(chǎng)景文本檢測(cè)方法。
背景技術(shù)
在無人駕駛技術(shù)中,通過感知技術(shù)來進(jìn)行三維環(huán)境建模是一項(xiàng)重要的工作。在真實(shí)道路場(chǎng)景中存在著許多相關(guān)的建模數(shù)據(jù),如交通標(biāo)志牌、車牌、路牌、廣告牌中的文本信息。而自然場(chǎng)景圖像中的文本檢測(cè)與識(shí)別可用于自動(dòng)提取其中的文本信息,是計(jì)算機(jī)視覺中的重要研究方向之一。近年來,研究學(xué)者們的研究已經(jīng)取得了一定的突破,并且搭建了一系列評(píng)估數(shù)據(jù)庫(kù)。然而,由于圖像場(chǎng)景多變、文本多樣等因素,在場(chǎng)景圖像中進(jìn)行文本檢測(cè)與識(shí)別仍然存在諸多挑戰(zhàn)。
在過去幾十年中,許多用于文檔文本提取與識(shí)別的方法以及光學(xué)識(shí)別系統(tǒng)已經(jīng)得到充分開發(fā)。Burns 等人(T. J. Burns, J. J. Corso. Robust UnsupervisedSegmentation of Degraded Document Images with Topic Models[C]. Proceedings ofIEEE Conference on Computer Vision and Pattern Recognition. 2009, 1287-1294.)提出了一種用于文檔圖像的貝葉斯生成模型,基于主題進(jìn)行圖像分區(qū)來區(qū)分文本、空格和圖形。Liang 等人(J. Liang, D. Dementhon, D. Doermann. Geometric Rectificationof Camera-Captured Document Images[J]. IEEE Transactions on Pattern Analysisand Machine Intelligence.2008. 30(4):591.)利用從圖像獲得的紋理流信息估計(jì)3D文檔形狀來進(jìn)行平面和彎曲文檔的幾何矯正。但是,與文檔文本不同的是,自然場(chǎng)景文本是以任意形狀、大小、字體、方向、透視失真等特點(diǎn)嵌入到擁有復(fù)雜背景的圖像中,因此對(duì)自然場(chǎng)景文本的檢測(cè)更具有挑戰(zhàn)性。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廈門金龍聯(lián)合汽車工業(yè)有限公司,未經(jīng)廈門金龍聯(lián)合汽車工業(yè)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811021712.6/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





