[發明專利]參數識別方法、裝置和電子設備有效
| 申請號: | 202011046637.6 | 申請日: | 2020-09-29 |
| 公開(公告)號: | CN112115212B | 公開(公告)日: | 2023-10-03 |
| 發明(設計)人: | 馬健 | 申請(專利權)人: | 中國工商銀行股份有限公司 |
| 主分類號: | G06F16/28 | 分類號: | G06F16/28;G06Q10/067 |
| 代理公司: | 中科專利商標代理有限責任公司 11021 | 代理人: | 張琛 |
| 地址: | 100140 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 參數 識別 方法 裝置 電子設備 | ||
1.一種參數識別方法,包括:
獲取實體信息,所述實體信息包括至少一個屬性信息;
基于語料庫和規則庫處理至少一個所述屬性信息,得到針對至少一個所述屬性信息各自的識別結果,所述識別結果表征至少一個所述屬性信息各自屬于可參數化屬性信息或不可參數化屬性信息;以及
如果基于所述識別結果確定大于或等于預設個數閾值的屬性信息屬于不可參數化屬性信息,則確定所述實體信息是不可參數化實體信息。
2.根據權利要求1所述的方法,其中,所述語料庫包括第一詞庫、第二詞庫和語句庫中至少一種,其中,所述第一詞庫包括表征不可進行參數化的詞,所述第二詞庫包括表征可進行參數化的詞,所述語句庫包括表征不可進行參數化的語塊,所述語塊用于表征語句的結構信息,并且具有語義信息,所述第一詞庫的詞具有處于第一指定區間的詞向量,所述第二詞庫的詞具有處于第二指定區間的詞向量,所述第一指定區間和所述第二指定區間相同或不同。
3.根據權利要求2所述的方法,其中,所述屬性信息包括:屬性類型、實體名稱、屬性名稱或屬性釋義中至少一種;所述規則庫包括:反向預定義規則、正向規則中至少一種;
所述基于語料庫和規則庫處理至少一個所述屬性信息,得到針對至少一個所述屬性信息各自的識別結果包括:對于每一個屬性信息,
對所述屬性信息進行分詞,得到至少一個詞;
確定至少一個所述詞的詞向量;以及
基于所述語料庫、所述規則庫和至少一個所述詞的詞向量,確定針對至少一個所述屬性信息各自的識別結果。
4.根據權利要求3所述的方法,其中:
所述反向預定義規則包括以下至少一種:
如果所述實體名稱的分詞結果的詞向量位于所述第一指定區間中,則所述實體名稱不可參數化;
如果所述屬性名稱的分詞結果的詞向量位于所述第一指定區間中,則所述屬性名稱不可參數化;
如果所述屬性釋義的語義信息與所述語句庫的語塊的語義信息相匹配,則所述屬性釋義不可參數化;
如果所述屬性類型為指定類型,則所述屬性類型不可參數化;
所述正向規則包括以下至少一種:
所述實體名稱的分詞結果的詞向量位于所述第二指定區間中,則所述實體名稱可參數化;以及
所述屬性名稱的分詞結果的詞向量位于所述第二指定區間中,則所述屬性名稱可參數化。
5.根據權利要求3所述的方法,其中,所述規則庫還包括屬性權重規則;
所述屬性權重規則包括:當確定當前屬性信息中高權重的屬性不可參數化后,則確定所述當前屬性信息不可參數化,其中,屬性類型、實體名稱、屬性名稱、屬性釋義的權重依序降低。
6.根據權利要求1所述的方法,還包括:
如果基于所述識別結果確定少于預設個數閾值的屬性信息屬于不可參數化屬性信息,則確定所述實體信息是可參數化實體信息。
7.根據權利要求6所述的方法,還包括:在確定所述實體信息是不可參數化實體信息,或者在確定所述實體信息是可參數化實體信息之后,
基于所述實體信息擴充所述語料庫。
8.根據權利要求7所述的方法,其中,所述語料庫包括第一詞庫、第二詞庫和語句庫中至少一種,其中,所述第一詞庫包括表征不可進行參數化的詞,所述第二詞庫包括表征可進行參數化的詞;
所述基于所述實體信息擴充所述語料庫包括:
利用識別模型處理所述實體信息,得到用于表征所述實體信息屬于不可參數化實體信息的第一擴展詞,和/或用于表征所述實體信息屬于可參數化實體信息的第二擴展詞;以及
將所述第一擴展詞添加進所述第一詞庫,和/或,將所述第二擴展詞添加進所述第二詞庫。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國工商銀行股份有限公司,未經中國工商銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011046637.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種能夠進行場地維護的揀球機器人
- 下一篇:數據傾斜的預測方法及裝置





