[發明專利]詞鏈模型的生成方法、裝置、設備及計算機可讀存儲介質有效
| 申請號: | 201811462225.3 | 申請日: | 2018-11-30 |
| 公開(公告)號: | CN109753648B | 公開(公告)日: | 2022-12-20 |
| 發明(設計)人: | 黃越;陳明東 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F40/284 | 分類號: | G06F40/284;G06F40/247 |
| 代理公司: | 深圳市世紀恒程知識產權代理事務所 44287 | 代理人: | 胡海國 |
| 地址: | 518000 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 模型 生成 方法 裝置 設備 計算機 可讀 存儲 介質 | ||
1.一種詞鏈模型的生成方法,其特征在于,所述詞鏈模型的生成方法包括以下步驟:
讀取預設標準詞庫中的標準詞以及與所述標準詞對應的各目標分詞,將各所述目標分詞拆分為單個的目標漢字;
根據所述預設標準詞庫中的各標準分詞,確定各所述目標漢字在各層級上的字鏈模型,其中所述層級的級數與所述標準詞中漢字的數量對應;
將各所述目標漢字在各層級上的字鏈模型進行合并,生成所述標準詞在各層級上的分詞集合,并根據所述分詞集合,形成所述標準詞的詞鏈模型;
所述根據所述預設標準詞庫中的各標準分詞,確定各所述目標漢字在各層級上的字鏈模型的步驟包括:
將各所述目標漢字和各所述標準分詞對比,確定包含各所述目標漢字的目標標準分詞;
統計各所述目標標準分詞中所包括的漢字個數,將具有相同所述漢字個數的各目標標準分詞形成各所述目標漢字在各層級上的字鏈模型;
所述將各所述目標漢字在各層級上的字鏈模型進行合并,生成所述標準詞在各層級上的分詞集合的步驟包括:
讀取各所述目標漢字所生成的各所述字鏈模型中在同一層級上的目標字鏈模型,并將各所述目標字鏈模型中所具有的所述目標標準分詞進行合并,形成字鏈集合;
判斷所述字鏈集合中是否存在重復的所述目標標準分詞,若存在重復的所述目標標準分詞,則將重復的所述目標標準分詞從所述字鏈集合中刪除,并檢測各所述目標漢字在各層級上是否均形成所述字鏈集合;
若各所述目標漢字在各層級上均形成所述字鏈集合,則將各所述字鏈集合確定為所述標準詞在各層級上的分詞集合。
2.如權利要求1所述的詞鏈模型的生成方法,其特征在于,所述根據所述分詞集合,形成所述標準詞的詞鏈模型的步驟包括:
將所述標準詞和各層級上分詞集合中的目標標準分詞對比,從各層級上的分詞集合中確定包括各個數量所述目標漢字的目標分詞集合;
當所述目標分詞集合中的目標標準分詞包括所述目標漢字的數量和所述標準詞中漢字數量一致時,將各所述目標分詞集合形成所述標準詞在各所述層級上的詞鏈模型。
3.如權利要求2所述的詞鏈模型的生成方法,其特征在于,所述將具有相同所述漢字個數的各目標標準分詞形成各所述目標漢字在各層級上的字鏈模型的步驟之后包括:
判斷所述目標漢字中是否存在重復漢字,若存在所述重復漢字,則對存在所述重復漢字的所述目標漢字,在各層級上字鏈模型中的目標標準分詞設置字鏈權重。
4.如權利要求3所述的詞鏈模型的生成方法,其特征在于,所述將各所述目標分詞集合形成所述標準詞在各所述層級上的詞鏈模型的步驟包括:
檢測各所述目標分詞集合中是否包括攜帶有預設權重標識符的權重標準分詞,若包括攜帶有預設權重標識符的權重標準分詞,則讀取與所述預設權重標識符對應的字鏈權重;
將對應的所述字鏈權重添加到各所述目標分詞集合中的權重標準分詞上,并將經添加所述字鏈權重后的各所述目標分詞集合形成所述標準詞在各所述層級上的詞鏈模型。
5.如權利要求1-4任一項所述的詞鏈模型的生成方法,其特征在于,所述形成所述標準詞的詞鏈模型的步驟之后包括:
對所述標準詞添加完成標識符,并判斷所述預設標準詞庫中的標準詞是否均攜帶所述完成標識符;
若均攜帶所述完成標識符,則完成所述預設標準詞庫中各所述標準詞的詞鏈模型的生成;
若不均攜帶所述完成標識符,執行讀取預設標準詞庫中的標準詞以及與所述標準詞對應的各目標分詞的步驟,且所讀取的標準詞為不攜帶完成標識符的標準詞。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811462225.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:段落的劃分方法及裝置
- 下一篇:基于細粒度匹配信號的文本相關性度量方法和系統





