[發明專利]一種意圖理解方法、裝置、設備及存儲介質在審
| 申請號: | 202010591965.8 | 申請日: | 2020-06-24 |
| 公開(公告)號: | CN111738018A | 公開(公告)日: | 2020-10-02 |
| 發明(設計)人: | 周楠楠;湯耀華;楊海軍;徐倩 | 申請(專利權)人: | 深圳前海微眾銀行股份有限公司 |
| 主分類號: | G06F40/35 | 分類號: | G06F40/35;G06F40/211;G06F40/216;G06F40/279;G06F16/35;G06F16/332;G06Q30/00 |
| 代理公司: | 北京同達信恒知識產權代理有限公司 11291 | 代理人: | 張懷陽 |
| 地址: | 518027 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 意圖 理解 方法 裝置 設備 存儲 介質 | ||
1.一種意圖理解方法,其特征在于,包括:
獲取待意圖理解的句子;
確定所述待意圖理解的句子是否存在成分缺失;
若是,則確定出所述待意圖理解的句子缺失的成分,并根據所述待意圖理解的句子缺失的成分確定所述待意圖理解的句子缺失的成分對應的詞性;
根據所述詞性確定出與所述詞性對應的備選詞集,并根據所述備選詞集以及所述待意圖理解的句子,確定出補全后的句子;
對所述補全后的句子進行意圖理解,確定出所述待意圖理解的句子的意圖。
2.如權利要求1所述的方法,其特征在于,所述根據所述詞性確定出與所述詞性對應的備選詞集,包括:
根據所述詞性,從位于所述待意圖理解的句子之前的句子中確定出與所述詞性對應的詞,得到所述詞性對應的備選詞集。
3.如權利要求1所述的方法,其特征在于,所述根據所述備選詞集以及所述待意圖理解的句子,確定出補全后的句子,包括:
將所述備選詞集中每個詞填充到所述待意圖理解的句子,得到多個填充后的句子;
將所述多個填充后的句子輸入到語言模型進行處理,得到各個與所述待意圖理解的句子匹配的概率,并將所述各個與所述待意圖理解的句子匹配的概率進行對比,確定出概率符合預設條件的填充后的句子,并將概率符合預設條件的填充后的句子確定為所述補全后的句子。
4.如權利要求3所述的方法,其特征在于,所述將所述各個與所述待意圖理解的句子匹配的概率進行對比,確定出概率符合預設條件的填充后的句子,并將概率符合預設條件的填充后的句子確定為所述補全后的句子,包括:
將所述各個與所述待意圖理解的句子匹配的概率進行對比,確定出最大匹配概率,并確定出所述最大匹配概率對應的填充后的句子;
若所述最大匹配概率大于且等于預設閾值,則將所述最大匹配概率對應的填充后的句子確定為所述補全后的句子。
5.如權利要求1所述的方法,其特征在于,所述確定所述待意圖理解的句子是否存在成分缺失,包括:
將所述待意圖理解的句子輸入到語義角色標注模型進行語義識別,確定所述待意圖理解的句子是否存在成分缺失;所述語義角色標注模型是使用第一訓練樣本對預設的序列標注模型進行訓練確定的。
6.如權利要求5所述的方法,其特征在于,所述使用第一訓練樣本對預設的序列標注模型進行訓練確定所述語義角色標注模型,包括:
獲取所述第一訓練樣本;
對所述第一訓練樣本進行預處理,得到處理后的所述第一訓練樣本;
將所述處理后的所述第一訓練樣本輸入到預訓練模型進行向量化處理,得到所述處理后的所述第一訓練樣本中每個字的字向量;
將所述每個字的字向量對所述預設的序列標注模型進行訓練,得到所述語義角色標注模型。
7.如權利要求1至6任一項所述的方法,其特征在于,所述對所述補全后的句子進行意圖理解,確定出所述待意圖理解的句子的意圖之前,所述方法還包括:
獲取所述第二訓練樣本;
對所述第二訓練樣本進行預處理,得到處理后的所述第二訓練樣本;
將所述處理后的所述第二訓練樣本輸入到所述預訓練模型進行向量化處理,得到所述處理后的所述第二訓練樣本中每個句子的句子向量;
將所述每個句子的句子向量對預設的分類模型進行訓練,得到意圖理解模型;
所述對所述補全后的句子進行意圖理解,確定出所述待意圖理解的句子的意圖,包括:
將所述補全后的句子輸入到所述意圖理解模型進行理解,確定出所述待意圖理解的句子的意圖。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳前海微眾銀行股份有限公司,未經深圳前海微眾銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010591965.8/1.html,轉載請聲明來源鉆瓜專利網。





