[發明專利]一種基于分段和結構的藏文字構件識別方法有效
| 申請號: | 202110115435.0 | 申請日: | 2021-01-28 |
| 公開(公告)號: | CN112818673B | 公開(公告)日: | 2023-08-22 |
| 發明(設計)人: | 孫琦龍;安見才讓 | 申請(專利權)人: | 青海民族大學 |
| 主分類號: | G06F40/279 | 分類號: | G06F40/279;G06F40/237 |
| 代理公司: | 成都正德明志知識產權代理有限公司 51360 | 代理人: | 張小娟 |
| 地址: | 810007 青*** | 國省代碼: | 青海;63 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 分段 結構 藏文 構件 識別 方法 | ||
本發明公開了一種基于分段和結構的藏文字構件識別方法。該方法包括構建藏文字結構字典;對待識別藏文字進行分段;掃描分段后的藏文字各結構,轉換得到各結構對應類型;根據各結構對應類型,在藏文字結構字典中查找出各結構中各構件的位置值;根據各結構中對應各構件位置值,識別出待識別藏文字的各個構件。本發明為了解決現有技術中的藏文字構件識別方法需要基于30個輔音進行復雜而深層次的判斷的問題,提出了一種基于藏文字結構的構件識別方法,具有簡單高效且易于操作的優點。
技術領域
本發明涉及一種藏文字構件識別方法,尤其涉及一種基于分段和結構的藏文字構件識別方法。
背景技術
藏文字組字構件的自動識別,是藏文字、詞層面信息化研究的一項基礎工作。根據現代藏文文法,揭示并實現組字部件的自動識別對藏文字、詞、句法層面的信息化有著重要的作用。現有技術中存在各種基于30個輔音的識別藏文字構件的方法,這些方法要進行復雜而深層次的判斷,非常復雜。
發明內容
針對現有技術中的上述不足,本發明提供了一種基于分段和結構的藏文字構件識別方法。
為了達到上述發明目的,本發明采用的技術方案為:
S1、構建藏文字結構字典;
S2、對待識別藏文字進行分段;
S3、掃描步驟S2分段后的藏文字各結構,轉換得到各結構對應類型;
S4、根據步驟S3中得到的各結構對應類型,在步驟S1構建的藏文字結構字典中查找出各結構對應各構件位置值;
S5、根據各結構中對應各構件位置值,識別出待識別藏文字的各個構件。
本發明具有以下有益效果:本發明基于藏文字結構進行了藏文字構建識別,沒有利用復雜的藏文文法規則,相較于現有技術中復雜困難的藏文字構件識別方法,本發明具有簡單高效且易于操作的優點。
優選地,步驟S1包括以下分步驟:
S11、將藏文字分段為前件、后件和元件;
S12、基于步驟S11的分段結果得到前件、后件和元件的類型及各類型對應構件位置值;
S13、設定前件、后件和元件的類型為藏文字結構字典的檢索關鍵字,再將各類型對應構件位置的位置變量和位置值為字典值建成字典,完成藏文字結構字典構建。
該優選方案具有以下有益效果:構建藏文字結構字典便于后續步驟對藏文字進行構件識別,僅需一次藏文字結構字典構建即可對任意藏文字進行識別,使本發明操作簡單,具有泛用性。
優選地,步驟S11具體包括:
將藏文字分段為前件、后件和元件,其中前件包括前加字、上加字、基字和下加字,后件包括后加字和再后加字,元件包括元音。
該優選方案具有以下有益效果:將藏文字按結構分為了前件、后件和元件三個部件,便于后續步驟對三個部件結構確定所含構件位置值。
優選地,步驟S12包括以下分步驟:
步驟S12包括以下分步驟:
S121、采用t6、t5、t4、t3、t2、t1和t0分別表示藏文字的基字、前加字、上加字、下加字、元音、后加字和再后加字,pt6、pt5、pt4、pt3、pt2、pt1和pt0分別表示藏文字的基字、前加字、上加字、下加字、元音、后加字和再后加字的位置;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于青海民族大學,未經青海民族大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110115435.0/2.html,轉載請聲明來源鉆瓜專利網。





