[發明專利]一種數字化漢字拼字實現方法和裝置有效
| 申請號: | 201611129421.X | 申請日: | 2016-12-09 |
| 公開(公告)號: | CN106776499B9 | 公開(公告)日: | 2021-02-12 |
| 發明(設計)人: | 薛永增;劉超然;趙東 | 申請(專利權)人: | 哈爾濱工業大學 |
| 主分類號: | G06F40/126 | 分類號: | G06F40/126;A63F9/06 |
| 代理公司: | 哈爾濱市陽光惠遠知識產權代理有限公司 23211 | 代理人: | 蔡巖巖 |
| 地址: | 150006 黑龍*** | 國省代碼: | 黑龍江;23 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數字化 漢字 拼字 實現 方法 裝置 | ||
本發明提出一種數字化漢字拼字實現方法和裝置,屬于數字化漢字拼字技術領域。該方法用精確到筆畫的漢字組成部分的相對空間位置來表示漢字,并在顯示設備上顯示和拖拽漢字的組成部件;當漢字的組成部件在相對空間位置上能夠拼合成一個字的時候,識別拼合出來的漢字;顯示該漢字的相關信息,如讀音、字義、組詞、例句等。該方法能夠對漢字產生精確的識別。
技術領域
本發明涉及一種數字化漢字拼字實現方法和裝置,屬于數字化漢字拼字技術領域。
背景技術
現有的漢字構型的表示方法,多是以漢字的筆畫輸入為目標,在這類表示方法中,沒有漢字各個組成部分空間結構的完整信息,不能實現對漢字任意拆分方式的還原。例如,很多這類構型方法中,僅能表示出“思”這樣的合體字為上“田”下“心”結構,不能進一步表示“田”這樣的單體字。或者雖然能表示“田”這樣的單體字是3橫3豎結構,卻不能表示橫豎之間的空間位置關系,因此無法區分“田”、“由”、“甲”這類同樣由3橫3豎構成的字。
另一類漢字構型的表示方法,則主要針對構建漢字的字體庫,這類表示中漢字各個組成部分的空間位置是固定的,因此如果顯示的漢字在相對位置上構成漢字,但是各個筆畫的具體位置不同,用這種表示方法就無法區分了。如圖1所示,這兩個“思”字在人來看是一個字,但是右邊的字明顯和左邊根據字庫中生成的字有差別。
在識字教育中,往往需要讓使用者自己通過筆畫或部首拼合出漢字,然后再對漢字的具體讀音、字義、用法等進行詳細的解釋。目前基于數字化設備的拼字游戲往往是通過對所能處理的漢字的個數加以限制,或者對于使用者拼合過程中漢字組成部分的空間位置加以限定來實現拼字游戲的。這樣就不能對任意漢字通過任意組成部分進行拼字。例如:有些拼字游戲僅能實現用3個“口”拼合成“品”,不能進一步用6橫6豎拼合成“品”,或者需要先將6橫6豎拼合成3個“口”,再進一步拼合成“品”。有些拼字游戲需要把6橫6豎精確地放到某一個限定區域才能識別出拼出來的字是“品”。
另一種可能的實現方法是對于拼合以后的字通過模式識別的方法進行漢字識別,這種方法盡管識別率高,但是也難免會存在識別錯誤,甚至無法識別的情況。
總之,在目前的基于數字化設備的拼字游戲中,對于任何漢字,通過任何組成部分進行拼字,僅通過拼合后漢字各個組成部分的空間的相對位置來判斷是不是一個字是難以做到的。
發明內容
為解決上述現有技術中存在的技術問題,本發明提出了一種數字化漢字拼字實現方法和裝置。
一種數字化漢字拼字實現裝置,其特征在于,所述裝置包括:
用漢字的最小組成部件的相對位置空間表示漢字的表示模塊;
識別所述最小組成部件在相對空間位置上拼合成字的識別模塊;
顯示所述漢字相關信息的顯示模塊。
進一步地,所述裝置還包括:
對組成漢字的基本筆畫、難以用基本筆畫來構建的偏旁部首和單體字建立索引表的索引建立模塊;
將漢字拆分為代表基本筆畫、難以用基本筆畫來構建的偏旁部首和單體字的最小組成部件的漢字拆分模塊;
確定所述最小組成部件的最小矩形的矩形確定模塊;
確定所述最小矩形四個邊沿的相對空間位置關系的空間位置關系確定模塊。
進一步地,所述裝置還包括:
將漢字的所有最小部件進行編碼的字內編碼模塊;
根據索引表和字內編碼建立最小部件表的最小部件表建立模塊;
根據漢字所有最小矩形的相對空間位置關系建立位置關系表的位置關系表建立模塊;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈爾濱工業大學,未經哈爾濱工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611129421.X/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種數據導出為PDF的方法
- 下一篇:一種字庫紋理數據管理方法





