[發明專利]生僻漢字的編碼方法、裝置、電子設備及存儲介質在審
| 申請號: | 202110677209.1 | 申請日: | 2021-06-18 |
| 公開(公告)號: | CN113296614A | 公開(公告)日: | 2021-08-24 |
| 發明(設計)人: | 居浩宇;王珂;趙曉飛 | 申請(專利權)人: | 中國農業銀行股份有限公司 |
| 主分類號: | G06F3/023 | 分類號: | G06F3/023 |
| 代理公司: | 北京同立鈞成知識產權代理有限公司 11205 | 代理人: | 杜葉蕊;劉芳 |
| 地址: | 100005 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 生僻 漢字 編碼 方法 裝置 電子設備 存儲 介質 | ||
本申請實施例提供生僻漢字的編碼方法、裝置、電子設備及存儲介質,包括獲取生僻漢字集中各生僻漢字的漢字編碼序列;對各漢字編碼序列進行編碼轉換處理,以將所述各漢字編碼序列映射至EBCDIC編碼的保留區域,得到各生僻漢字的EBCDIC編碼序列;根據所述各生僻漢字的漢字編碼序列和相應的EBCDIC編碼序列,構建所述生僻漢字集的編碼轉換關系,從而實現了基于EBCDIC編碼格式的生僻漢字的編碼表示,解決了現有的IBM系統中無法支持生僻漢字的問題。
技術領域
本申請涉及計算機技術領域,尤其涉及一種生僻漢字的編碼方法、裝置、電子設備及存儲介質。
背景技術
目前,銀行平臺下的計算機通常使用IBM主機系統,而該主機下的ZOS系統一般僅支持EBCDIC編碼。
現有的EBCDIC編碼支持單字節字符集和雙字節字符集,其僅能支持約3萬個漢字。國際標準漢字包括約8萬個,其中不乏有會使用在人名或地名中使用到的生僻漢字。
但是,EBCDIC編碼的碼位已經分配給常用漢字或英文字符,并沒有空余的單字節字符集或雙字節字符集的碼位空間以分配給這些生僻漢字分配。因此,如何在現有的IBM主機系統上為這些生僻漢字進行編碼處理成為亟待解決的問題。
發明內容
本申請實施例提供一種生僻漢字的編碼方法、裝置、電子設備及存儲介質,以為生僻漢字的EBCDIC編碼處理提供解決方案。
一方面,本申請提供了一種生僻漢字的編碼方法,包括:
生僻漢字的編碼方法,其特征在于,包括:
獲取生僻漢字集中各生僻漢字的漢字編碼序列;
對各漢字編碼序列進行編碼轉換處理,以將所述各漢字編碼序列映射至EBCDIC編碼的保留區域,得到各生僻漢字的EBCDIC編碼序列;
根據所述各生僻漢字的漢字編碼序列和相應的EBCDIC編碼序列,構建所述生僻漢字集的編碼轉換關系。
可選實施例中,不同生僻漢字的漢字編碼序列映射至EBCDIC編碼的保留區域的不同編碼值上。
可選實施例中,所述EBCDIC編碼序列包括標識字節和轉換字節;
其中,所述標識字節用于表示所述EBCDIC編碼序列為生僻漢字的EBCDIC編碼序列;所述轉換字節用于區別不同的生僻漢字的EBCDIC編碼序列。
可選實施例中,所述轉換字節是通過對所述漢字編碼序列進行基于哈希算法的編碼轉換處理獲得的。
可選實施例中,所述標識字節位于所述EBCDIC編碼序列的頭字節。
可選實施例中,所述標識字節的編碼值的取值為FE。
可選實施例中,所述轉換字節的編碼值的取值范圍為C04141至ECFEBF。
可選實施例中,所述編碼方法還包括:
讀取所述生僻漢字集的編碼轉換關系;
根據待識別生僻漢字的漢字編碼,確定與所述待識別生僻漢字對應的EBCDIC編碼序列。
第二方面,本申請提供了一種生僻漢字的編碼裝置,包括:
獲取模塊,用于獲取生僻漢字集中各生僻漢字的漢字編碼序列;
轉換處理模塊,用于對各漢字編碼序列進行編碼轉換處理,以將所述各漢字編碼序列映射至EBCDIC編碼的保留區域,得到各生僻漢字的EBCDIC編碼序列;
構建模塊,用于根據所述各生僻漢字的漢字編碼序列和相應的EBCDIC編碼序列,構建所述生僻漢字集的編碼轉換關系。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國農業銀行股份有限公司,未經中國農業銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110677209.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:帶氣囊的通風蝶閥
- 下一篇:數據導出方法、裝置、設備及存儲介質





