[發明專利]一種用于構建詞典的方法、裝置及計算機可讀存儲介質有效
| 申請號: | 201710607574.9 | 申請日: | 2017-07-24 |
| 公開(公告)號: | CN109299453B | 公開(公告)日: | 2021-02-09 |
| 發明(設計)人: | 張旸;王雅圣;畢舒展;顏友亮 | 申請(專利權)人: | 華為技術有限公司 |
| 主分類號: | G06F40/242 | 分類號: | G06F40/242;G06F40/30;G06F40/211;G06K9/62 |
| 代理公司: | 北京龍雙利達知識產權代理有限公司 11329 | 代理人: | 時林;毛威 |
| 地址: | 518129 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用于 構建 詞典 方法 裝置 計算機 可讀 存儲 介質 | ||
1.一種用于構建詞典的方法,其特征在于,所述方法包括:
獲取候選詞;
從釋義知識庫中獲取所述候選詞的釋義;
從所述候選詞的釋義中,選擇所述候選詞的特征詞,所述候選詞的特征詞為所述候選詞的釋義中的實詞;
根據所述候選詞的特征詞,通過預設的分類器,得到所述候選詞的初始判定結果,所述分類器用于指示一個詞歸屬于所述詞典的概率;
根據從至少一個中間詞中每個中間詞的釋義中選擇的特征詞,通過所述分類器,得到所述每個中間詞的判定結果,其中,所述至少一個中間詞包括所述候選詞的N級特征詞,
所述N級特征詞為所述候選詞的特征詞,所述N=1,或,
所述N級特征詞中的第K級特征詞是從所述N級特征詞中的第K-1級特征詞的釋義中選擇的特征詞,所述N和K都為大于1的整數,且所述K小于或等于所述N;
根據所述候選詞的初始判定結果和所述至少一個中間詞的判定結果,確定所述候選詞的最終判定結果,所述候選詞的最終判定結果用于指示能否將所述候選詞添加至所述詞典。
2.根據權利要求1所述的方法,其特征在于,從所述候選詞的釋義中,選擇所述候選詞的特征詞,包括;
從所述候選詞的釋義中,選擇所述候選詞的釋義中的實詞;
將所述候選詞的釋義中的實詞和所述詞典中已收集的詞中共有的詞作為所述候選詞的特征詞。
3.根據權利要求1或2所述的方法,其特征在于,所述根據所述候選詞的特征詞,通過預設的分類器,得到所述候選詞的初始判定結果,包括:
根據所述候選詞的特征詞,確定所述候選詞的特征詞的詞性和所述候選詞的特征詞所屬的句法結構;
將所述候選詞的特征詞、所述候選詞的特征詞的詞性和所述候選詞的特征詞所屬的句法結構轉化為特征向量;
將所述特征向量作為輸入參數,通過所述分類器,得到所述初始判定結果。
4.根據權利要求1或2所述的方法,其特征在于,所述第K級特征詞具體是從所述第K-1級特征詞中用于生成第一判定結果的特征詞的釋義中選擇的特征詞,所述第一判定結果用于指示詞歸屬于所述詞典的概率滿足預設條件。
5.根據權利要求1或2所述的方法,其特征在于,所述根據所述候選詞的初始判定結果和所述至少一個中間詞的判定結果,確定所述候選詞的最終判定結果,包括:
在所述候選詞的初始判定結果用于指示所述候選詞歸屬于所述詞典的概率滿足預設條件,且所述至少一個中間詞的判定結果用于指示所述每個中間詞歸屬于所述詞典的概率滿足預設條件的情況下,確定所述候選詞的最終判定結果為所述候選詞能添加至所述詞典。
6.根據權利要求1或2所述的方法,其特征在于,所述根據所述候選詞的初始判定結果和所述至少一個中間詞的判定結果,確定所述候選詞的最終判定結果,包括:
將所述候選詞的初始判定結果和所述至少一個中間詞的判定結果轉化為判定向量;
將所述判定向量作為輸入參數,通過預設的第一公式,確定所述候選詞的最終判定結果,所述第一公式用于指示所述候選詞能否添加至所述詞典。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華為技術有限公司,未經華為技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710607574.9/1.html,轉載請聲明來源鉆瓜專利網。





