[發明專利]一種漢字字義、字音、字形的相似度比對系統及方法在審
| 申請號: | 201910098963.2 | 申請日: | 2019-01-31 |
| 公開(公告)號: | CN109840326A | 公開(公告)日: | 2019-06-04 |
| 發明(設計)人: | 宋晗;王博;張鑫慧;蔣寬;蘭恭偉 | 申請(專利權)人: | 浪潮軟件集團有限公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27 |
| 代理公司: | 濟南信達專利事務所有限公司 37100 | 代理人: | 姜明 |
| 地址: | 250100 山東*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 相似度比對 漢字 字義 字音 內存計算 服務層 數據層 管控 工作效率 名稱比對 大數據 相似度 存儲 審核 | ||
1.一種漢字字義、字音、字形的相似度比對系統,其特征在于:包括服務層、數據層和管控層,所述管控層設置有漢字相似度庫、漢字相似度比對規則和分布式內存計算,服務層中運行漢字相似度比對和分布式內存計算,數據層用于存儲名稱比對過程的數據。
2.根據權利要求1所述的漢字字義、字音、字形的相似度比對系統,其特征在于:還包括表現層,所述表現層用于申請人進行申請名稱的輸入并顯示名稱比對結果。
3.根據權利要求2所述的漢字字義、字音、字形的相似度比對系統,其特征在于:所述服務層中運行的分布式內存計算過程包括數據分片、多節點、并行計算和運算結果合并。
4.根據權利要求3所述的漢字字義、字音、字形的相似度比對系統,其特征在于:所述表現層采用個人電腦PC。
5.根據權利要求4所述的漢字字義、字音、字形的相似度比對系統,其特征在于:所述數據層采用Oracle數據庫。
6.一種漢字字義、字音、字形的相似度比對方法,其特征在于:該方法基于對申報名稱的字義、字音、字形相似度庫,對漢字字義、字音、字形進行分析比較,采用分布式計算,在海量已存在數據中進行比對運算并計算相似度評分,根據相似度評分自動對申報的名稱進行審核。
7.根據權利要求6所述的漢字字義、字音、字形的相似度比對方法,其特征在于:該方法具體包括以下步驟:
S1、將已申報成功的名稱數據加載到內存中供名稱申報相似度比對使用;
S2、名稱申請人從互聯網進行名稱申報填寫;
S3、填報完成后點擊“提交”,后臺對申報的名稱進行字義、字音、字形相似度比對;
S4、將比對結果展示給名稱申請人;
S5、對于新申報成功的名稱自動加載到內存中繼續參加相似度比對。
8.根據權利要求7所述的漢字字義、字音、字形的相似度比對方法,其特征在于:步驟S4中,對于符合名稱管理規定的名稱給予審核通過提示,對于相似度較高的名稱將名稱相似度列表進行展示,告知申請人審核不通過的原因。
9.根據權利要求8所述的漢字字義、字音、字形的相似度比對方法,其特征在于:步驟S5中,將已申請的名稱數據加載到內存中并進行分片處理,同時支持多節點并行運算,提高相似度比對速度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浪潮軟件集團有限公司,未經浪潮軟件集團有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910098963.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:基于點互信息的文本語義相似性度量方法
- 下一篇:一種詞匯識別方法及裝置





