[發(fā)明專利]一種漢語由字組詞方法及裝置在審
| 申請?zhí)枺?/td> | 201911045332.0 | 申請日: | 2019-10-30 |
| 公開(公告)號: | CN110781288A | 公開(公告)日: | 2020-02-11 |
| 發(fā)明(設計)人: | 于江德;李學鈺;趙紅丹;張津銘;張悅;楊英 | 申請(專利權)人: | 安陽師范學院 |
| 主分類號: | G06F16/335 | 分類號: | G06F16/335;G06F16/338;G06F40/205 |
| 代理公司: | 11424 北京修典盛世知識產權代理事務所(特殊普通合伙) | 代理人: | 楊方成 |
| 地址: | 455000 河南省安陽市弦歌*** | 國省代碼: | 河南;41 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 詞語 組詞 候選詞語 頻次統(tǒng)計 漢字 漢語 輸出組 語料庫 構詞 輸出 融合 網絡 | ||
1.一種漢語由字組詞方法,其特征在于,包括以下步驟:
S1、融合三種途徑獲得最終的詞語頻次統(tǒng)計結果;
S2、確定組詞漢字;
S3、由確定的漢字生成候選詞語;
S4、從最終的詞語頻次統(tǒng)計結果中根據候選詞語的詞語頻次由高到低依次選取設定數量的詞語;
S5、輸出組詞結果。
2.根據權利要求1所述的漢語由字組詞方法,其特征在于,步驟S1包括以下步驟:
S11、從現(xiàn)代漢語語料庫中獲得詞語頻次統(tǒng)計結果一;
S12、從教育部語信司確定的每年度十大網絡用語、十大流行語、十大新詞語中獲得詞語頻次統(tǒng)計結果二;
S13、將步驟S11和步驟S12中的統(tǒng)計結果通過網絡眾包讓參與者選擇出常見常用的詞語,從而融合形成最終的詞語頻次統(tǒng)計結果。
3.根據權利要求1所述的漢語由字組詞方法,其特征在于,步驟S2確定漢字包括以下步驟:由用戶輸入設定數量的漢字,或從字庫隨機抽取設定數量的漢字。
4.根據權利要求3所述的漢語由字組詞方法,其特征在于,字庫按照筆畫的數量分成多個等級,按照等級從字庫隨機抽取設定數量的漢字。
5.根據權利要求1所述的漢語由字組詞方法,其特征在于,步驟S3中由確定的漢字排列組合生成候選詞語,按候選詞語包含的字數由少到多依次排列。
6.一種漢語由字組詞裝置,其特征在于,包括:
詞語頻次統(tǒng)計模塊,融合三種途徑獲得最終的詞語頻次統(tǒng)計結果;
漢字確定模塊,用于由用戶輸入設定數量的漢字或從字庫隨機抽取設定數量的漢字確定組詞的漢字;
候選詞語生成模塊,由確定的漢字排列組合生成候選詞語,按候選詞語包含的字數由少到多依次排列;
篩選模塊,利用最終的詞語頻次統(tǒng)計結果從候選詞語中選取設定數量的詞語;
輸出模塊,用于輸出組詞結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于安陽師范學院,未經安陽師范學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911045332.0/1.html,轉載請聲明來源鉆瓜專利網。





