[發(fā)明專利]提取滿文單詞圖像中軸線的方法有效
| 申請?zhí)枺?/td> | 201810371803.6 | 申請日: | 2018-04-24 |
| 公開(公告)號: | CN108564078B | 公開(公告)日: | 2020-11-13 |
| 發(fā)明(設(shè)計(jì))人: | 鄭蕊蕊;李敏;賀建軍;許爽;吳寶春;盧海濤 | 申請(專利權(quán))人: | 大連民族大學(xué) |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20;G06K9/34 |
| 代理公司: | 大連智高專利事務(wù)所(特殊普通合伙) 21235 | 代理人: | 劉斌 |
| 地址: | 116600 遼寧省*** | 國省代碼: | 遼寧;21 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 提取 滿文 單詞 圖像 軸線 方法 | ||
提取滿文單詞圖像中軸線的方法,屬于文字切分領(lǐng)域,用于解決提高滿文切分精度的問題,技術(shù)要點(diǎn)是:定位滿文單詞圖像中軸線,檢測滿文單詞圖像中軸線寬度,效果是對于滿文單詞圖像中軸線提取,直接影響切分的準(zhǔn)確率,為了提供切分準(zhǔn)確率,必要的將中軸線提取的精度被提高,因而,將中軸線定位,并檢測其寬度,可以將中軸線準(zhǔn)確提取。
技術(shù)領(lǐng)域
本發(fā)明屬于文字切分領(lǐng)域,涉及一種提取滿文單詞圖像中軸線的方法。
背景技術(shù)
滿文是我國滿族、錫伯族等少數(shù)民族使用的語言文字,在清代作為法定文字被推廣和使用,形成了大量珍貴的滿文文獻(xiàn)。由于目前滿語文已瀕臨消失,滿族語言文化遺產(chǎn)亟待搶救和保護(hù)得到國家和社會各界的認(rèn)同和重視。研究滿文的光學(xué)字符識別技術(shù)對保護(hù)和傳承清代文化遺產(chǎn)顯得尤為重要。滿文是一種音素文字,共有38個(gè)字母,其中6個(gè)元音字母,22個(gè)輔音字母,此外還有10個(gè)專門用于拼寫漢語借詞的特定字母。滿文書寫采用字序從上到下,行款從左到右的規(guī)則。對于滿文識別往往需要先將滿文先切分基本單元(如字母等),再予以識別,因而,提高滿文識別的精度可以從提高其切分精度著手。
發(fā)明內(nèi)容
為了解決提高滿文切分精度的問題,本發(fā)明提出如下技術(shù)方案:
一種提取滿文單詞圖像中軸線的方法,包括如下步驟:
S1.定位滿文單詞圖像中軸線;
S2.檢測滿文單詞圖像中軸線寬度。
作為技術(shù)方案的補(bǔ)充:所述步驟S1具體包括:
S1.1.對滿文單詞圖像取反,令文字部分的像素值取1,而背景部分的像素值取0;
S1.2.使用MATLAB圖像處理工具箱的形態(tài)學(xué)細(xì)化函數(shù)實(shí)現(xiàn)滿文單詞圖像的形態(tài)學(xué)細(xì)化;
S1.3.對形態(tài)學(xué)細(xì)化后的滿文單詞圖像,使用霍夫變換以確定細(xì)化的中軸線所對應(yīng)的列坐標(biāo),該列坐標(biāo)作為滿文單詞圖像中軸線的位置,其中,限定霍夫變換搜索直線的角度為θ=90,僅查找豎直方向的直線,并連接相同縱向位置的,間距小于滿文單詞圖像高度且自身長度大于1個(gè)像素的直線為一條直線,求出中軸線的中心位置。
作為技術(shù)方案的補(bǔ)充:所述步驟S2具體包括:
S2.1.確定最大游程比例法的搜索區(qū)域;
S2.2.對滿文單詞圖像在搜索區(qū)域內(nèi)施以最大游程比例法而確定滿文單詞圖像中軸線的寬度;
S2.3.由滿文單詞圖像中軸線的中心位置和中軸線的寬度計(jì)算中軸線的左邊界和右邊界。
作為技術(shù)方案的補(bǔ)充:所述步驟S2.1具體為:
最大游程比例法的搜索區(qū)域由下述公式規(guī)定的范圍所確定:
其中,sl是限定的搜索范圍的左邊界,sr是限定的搜索范圍的右邊界,baseline是中軸線的中心位置,round表示向最近的整數(shù)取整,W是滿文單詞圖像的寬度。
作為技術(shù)方案的補(bǔ)充:所述步驟S2.2的最大游程比例法的步驟:掃描滿文單詞圖像搜索區(qū)域單詞圖像的每一行,并統(tǒng)計(jì)連續(xù)黑色像素的游程長度和該長度出現(xiàn)的次數(shù),則具有最大出現(xiàn)次數(shù)的游程長度就是滿文單詞圖像中軸線的寬度。
作為技術(shù)方案的補(bǔ)充:由下式計(jì)算所述步驟S2.3的中軸線的左邊界和右邊界;
其中:bl是中軸線的左邊界,br是中軸線的右邊界,baseline是滿文單詞圖像中軸線的中心位置,baseline_width是滿文單詞圖像中軸線的寬度,round表示向最近的整數(shù)取整。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于大連民族大學(xué),未經(jīng)大連民族大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810371803.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





