[發(fā)明專利]對(duì)滿文單詞正確分割各識(shí)別的滿文單詞中軸線的定位方法有效
| 申請(qǐng)?zhí)枺?/td> | 201810580666.7 | 申請(qǐng)日: | 2015-09-29 |
| 公開(公告)號(hào): | CN108830270B | 公開(公告)日: | 2021-10-08 |
| 發(fā)明(設(shè)計(jì))人: | 李敏;鄭蕊蕊;許爽;吳寶春 | 申請(qǐng)(專利權(quán))人: | 大連民族大學(xué) |
| 主分類號(hào): | G06K9/20 | 分類號(hào): | G06K9/20 |
| 代理公司: | 大連智高專利事務(wù)所(特殊普通合伙) 21235 | 代理人: | 馬慶朝;赫澤坤 |
| 地址: | 116600 遼寧省*** | 國(guó)省代碼: | 遼寧;21 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 滿文 單詞 正確 分割 識(shí)別 軸線 定位 方法 | ||
1.一種對(duì)滿文單詞正確分割各識(shí)別的滿文單詞中軸線的定位方法,其特征在于,包括以下步驟:
S1.單詞圖像預(yù)處理;
S2.確定滿文單詞中軸線的寬度;
S3.確定滿文單詞中軸線左右邊界位置;
所述的滿文單詞圖像預(yù)處理的步驟為:掃描滿文文檔,獲得滿文文檔的彩色圖像,并對(duì)滿文文檔的彩色圖像進(jìn)行二值化,采用垂直投影法提取每一列滿文文檔的圖像,獲得列圖像,并對(duì)列圖像采用水平投影法提取滿文單詞圖像,然后對(duì)滿文單詞圖像進(jìn)行位置歸一化處理,歸一化處理的步驟是找到滿文單詞圖像最外側(cè)上、下、左、右四個(gè)點(diǎn)的坐標(biāo)位置,以這四個(gè)點(diǎn)為邊界,重新確定滿文單詞圖像的大小,并用I、W、H分別表示歸一化處理后的二值滿文單詞圖像、二值滿文單詞圖像的寬度數(shù)值和二值滿文單詞圖像的高度數(shù)值;
所述的確定滿文單詞中軸線寬度的步驟為:對(duì)二值滿文單詞圖像I采用數(shù)學(xué)形態(tài)學(xué)進(jìn)行處理,具體方法是采用長(zhǎng)度為2的水平方向直線型形態(tài)學(xué)結(jié)構(gòu)元素,對(duì)二值滿文單詞圖像I進(jìn)行腐蝕處理,得到I的腐蝕圖像Ie,并求二值滿文單詞圖像I與腐蝕圖像Ie的縱向邊緣圖像Iv,即Iv=I-Ie,提取到滿文單詞的縱向邊緣,然后對(duì)縱向邊緣圖像Iv進(jìn)行垂直投影,統(tǒng)計(jì)縱向邊緣圖像Iv的每一列中所包含的黑色像素的個(gè)數(shù),垂直投影序列以vp1表示,取向量vp1中不重復(fù)的元素,并按照數(shù)值從大到小的降序方式進(jìn)行排列,得到新的向量vp2,并取vp2中的前3個(gè)元素分別標(biāo)記為ind1、ind2和ind3,用wd表示中軸線的寬度,wdmin表示最小中軸線寬度,賦值wdmin=0,wdmax表示最大中軸線寬度,T為最大中軸線寬度的閾值,賦值T=1/3,則最大中軸線寬度wdmax為對(duì)T×W的結(jié)果向下取整后的值,即分別定義wd1、wd2、wd3為3個(gè)候選中軸線寬度,wd表示最終確定的中軸線寬度,其中wd1=∣ind1-ind2∣-1,wd2=∣ind1-ind3∣-1,wd3=∣ind2-ind3∣-1,
如果wdminwd1wdmax并且wdminwd2wdmax并且wdminwd3wdmax,則wd=wd1,
如果wdminwd1wdmax并且wdminwd2wdmax并且wd3=wdmin或者wd3=wdmax,則取wd1和wd2中值較大的一個(gè)做為wd的輸出值,即wd=max(wd1,wd2),
如果wdminwd1wdmax并且wdminwd3wdmax并且wd2=wdmin或者wd2=wdmax,則取wd1和wd3中值較大的一個(gè)做為wd的輸出值,即wd=max(wd1,wd3),
如果wdminwd2wdmax并且wdminwd3wdmax并且wd1=wdmin或者wd1=wdmax,則取wd2和wd3中值較大的一個(gè)做為wd的輸出值,即wd=max(wd2,wd3),
如果wdminwd1wdmax并且wd2=wdmin或者wd2=wdmax并且wd3=wdmin或者wd3=wdmax,則wd=wd1,
如果wdminwd2wdmax并且wd1=wdmin或者wd1=wdmax并且wd3=wdmin或者wd3=wdmax,則wd=wd2,
如果wdminwd3wdmax并且wd1=wdmin或者wd1=wdmax并且wd2=wdmin或者wd2=wdmax,則wd=wd3,
如果wd1=wdmin或者wd1=wdmax并且wd2=wdmin或者wd2=wdmax并且wd3=wdmin或者wd3=wdmax,則wd=wdmax。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于大連民族大學(xué),未經(jīng)大連民族大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810580666.7/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 信息處理裝置、信息處理方法
- 內(nèi)容轉(zhuǎn)換方法和裝置
- 基于單詞級(jí)別的備選生成的語(yǔ)音識(shí)別系統(tǒng)及方法
- 文字輸入裝置及文字輸入方法
- 基于音節(jié)拼讀的單詞學(xué)習(xí)系統(tǒng)及其單詞學(xué)習(xí)方法
- 單詞擴(kuò)展方法、單詞擴(kuò)展裝置以及程序
- 一種根據(jù)用戶反饋生成單詞復(fù)習(xí)列表的方法
- 一種便于輸入單詞的輸入法
- 英文單詞和語(yǔ)句篩選方法、裝置、存儲(chǔ)介質(zhì)及電子設(shè)備
- 一種單詞循環(huán)播放復(fù)習(xí)方法、存儲(chǔ)設(shè)備及移動(dòng)終端





