[發(fā)明專利]基于全卷積神經(jīng)網(wǎng)絡(luò)的中文字符圖像筆劃提取方法、系統(tǒng)有效
| 申請?zhí)枺?/td> | 201910454930.7 | 申請日: | 2019-05-29 |
| 公開(公告)號: | CN110232337B | 公開(公告)日: | 2021-02-02 |
| 發(fā)明(設(shè)計(jì))人: | 劉成林;王鐵強(qiáng) | 申請(專利權(quán))人: | 中國科學(xué)院自動(dòng)化研究所 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06N3/04 |
| 代理公司: | 北京市恒有知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11576 | 代理人: | 郭文浩;尹文會(huì) |
| 地址: | 100190 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 卷積 神經(jīng)網(wǎng)絡(luò) 中文 字符 圖像 筆劃 提取 方法 系統(tǒng) | ||
本發(fā)明屬于計(jì)算機(jī)視覺及模式識(shí)別領(lǐng)域,具體涉及了一種基于全卷積神經(jīng)網(wǎng)絡(luò)的中文字符圖像筆劃提取方法、系統(tǒng),旨在解決自由書寫的手寫字符筆劃提取困難的問題。本發(fā)明方法包括:對獲取的中文字符圖像進(jìn)行區(qū)域提?。粚化B區(qū)域、非交疊區(qū)域進(jìn)行骨架化操作;計(jì)算骨架化后的交疊區(qū)域任意筆劃段之間的連貫度;將交疊區(qū)域中屬于同一筆劃的筆劃段相連,與非交疊區(qū)域中直接相連的筆劃段合并成完整的骨架形態(tài)筆劃。本發(fā)明一方面在自由書寫的手寫中文字符筆劃重疊的情況下,依然可以實(shí)現(xiàn)手寫中文字符的筆劃提取,另一方面采用了字符合成方法獲取訓(xùn)練樣本,并附帶其在不同任務(wù)中的不同標(biāo)注信息,極大地節(jié)約了人力成本。
技術(shù)領(lǐng)域
本發(fā)明屬于計(jì)算機(jī)視覺及模式識(shí)別領(lǐng)域,具體涉及了一種基于全卷積神經(jīng)網(wǎng)絡(luò)的中文字符圖像筆劃提取方法、系統(tǒng)。
背景技術(shù)
中文字符圖像的筆劃提取在基于結(jié)構(gòu)分析的文字識(shí)別研究和相關(guān)應(yīng)用中具有重要地位?;谏疃葘W(xué)習(xí)技術(shù)的中文手寫/印刷字符的單字分類已經(jīng)取得了相當(dāng)高的正確率,但是,在很多應(yīng)用中,人們不僅關(guān)心字符的類別,還關(guān)注筆劃解釋、書寫質(zhì)量評價(jià)、形狀美化、字體設(shè)計(jì)等問題,而這就需要對文字圖像中的筆劃進(jìn)行分割和提取。
對于脫機(jī)中文字符的筆劃提取問題,過去已有算法主要有兩類:直接提取法和基于字符骨架的提取方法。其中,直接提取的方法主要用于印刷體字符,在字符圖像具備平滑的邊緣、簡單的筆劃形狀、固定的筆劃寬度和清晰的筆劃間關(guān)系時(shí),這一類方法的效果較好,例如Tseng和Chuang等研究者[1]從多種印刷字體的字符結(jié)構(gòu)中總結(jié)出一些通用性的規(guī)律,通過啟發(fā)式規(guī)則來進(jìn)行筆劃提取;Cao和Tan等[2]將印刷字符按照類似的規(guī)律切分為筆劃段(共計(jì)3種類型),之后再將這些筆劃段篩選、重組為獨(dú)立筆劃;Lee和Wu[3]將印刷字符圖像表示為圖(Graph)的形式,并在筆劃的交疊區(qū)域根據(jù)輪廓特征來推斷筆劃段間的連接關(guān)系;Chen等人[4]則從標(biāo)準(zhǔn)字體中學(xué)習(xí)出二維流形,再用與流形對應(yīng)的模板字符(其中筆劃已提取完畢)來指導(dǎo)真實(shí)印刷樣本的筆劃提取。當(dāng)處理脫機(jī)手寫字符圖像時(shí),由于自由手寫字符在筆劃形狀和筆劃間關(guān)系上具有較高的多樣性和復(fù)雜性,利用啟發(fā)式規(guī)則直接提取筆劃很難達(dá)到理想的效果。因此,現(xiàn)有的大部分對于脫機(jī)手寫字符進(jìn)行筆劃提取的工作都是在字符骨架上進(jìn)行操作的,這種操作把連通區(qū)域級上的筆劃提取任務(wù)簡化為線條級別上的提取[5]。在字符骨架上進(jìn)行筆劃提取時(shí),已有的大部分方法所采用的規(guī)則與直接提取法中的相關(guān)部分是類似的。基于骨架化的筆劃提取面臨骨架扭曲(尤其是筆劃交疊區(qū)域)、筆劃段連接歧義的問題,至今尚沒有很好地解決方法。
總的來說,雖然研究者們提出了很多關(guān)于中文印刷/手寫字符圖像中筆劃提取的方法,但是主要關(guān)注的還是比較規(guī)范的字符。對于自由書寫的手寫字符,由于筆劃形態(tài)和位置多變,加上筆劃重疊區(qū)域的情況非常復(fù)雜,給筆劃提取帶來了巨大的挑戰(zhàn),現(xiàn)有方法尚未給出令人滿意的結(jié)果。
以下文獻(xiàn)是與本發(fā)明相關(guān)的技術(shù)背景資料:
[1]Lin Yu Tseng and Chen-Tsun Chuang.An efficient knowledge-basedstroke extraction method for multi-font Chinese characters.PatternRecognition,25(12):1445-1458,1992.
[2]Ruini Cao and Chew Lim Tan.A model of stroke extraction fromChinese character images.In.Proceedings of the 15th International Conferenceon Pattern Recognition,2000.
[3]Chungnan Lee and Bohom Wu.A Chinese-character-stroke-extractionalgorithm based on contour information.Pattern Recognition,31(6):651-663,1998.
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國科學(xué)院自動(dòng)化研究所,未經(jīng)中國科學(xué)院自動(dòng)化研究所許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910454930.7/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 卷積運(yùn)算處理方法及相關(guān)產(chǎn)品
- 一種卷積神經(jīng)網(wǎng)絡(luò)的計(jì)算方法及系統(tǒng)
- 卷積運(yùn)算方法及系統(tǒng)
- 卷積運(yùn)算方法、裝置及系統(tǒng)
- 深度神經(jīng)網(wǎng)絡(luò)裁剪方法、裝置及電子設(shè)備
- 基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法和圖像處理裝置
- 卷積神經(jīng)網(wǎng)絡(luò)及基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法
- 一種圖像處理方法、裝置以及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 用于卷積神經(jīng)網(wǎng)絡(luò)的卷積運(yùn)算裝置
- 基于FPGA實(shí)現(xiàn)圖像識(shí)別的方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 硬件神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法、計(jì)算裝置、軟硬件協(xié)作系統(tǒng)
- 生成較大神經(jīng)網(wǎng)絡(luò)
- 神經(jīng)網(wǎng)絡(luò)的生成方法、生成裝置和電子設(shè)備
- 一種舌診方法、裝置、計(jì)算設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
- 脈沖神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法及相關(guān)轉(zhuǎn)換芯片
- 圖像處理方法、裝置、可讀存儲(chǔ)介質(zhì)和計(jì)算機(jī)設(shè)備
- 一種適應(yīng)目標(biāo)數(shù)據(jù)集的網(wǎng)絡(luò)模型微調(diào)方法、系統(tǒng)、終端和存儲(chǔ)介質(zhì)
- 用于重構(gòu)人工神經(jīng)網(wǎng)絡(luò)的處理器及其操作方法、電氣設(shè)備
- 一種圖像神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化方法及裝置





