[發明專利]一種意圖識別方法及裝置有效
| 申請號: | 202010320457.6 | 申請日: | 2020-04-22 |
| 公開(公告)號: | CN111581361B | 公開(公告)日: | 2023-09-15 |
| 發明(設計)人: | 童麗霞;雷植程;楊念民 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F40/30;G06F40/211;G06N3/0442;G06N3/0464 |
| 代理公司: | 北京同達信恒知識產權代理有限公司 11291 | 代理人: | 李娟 |
| 地址: | 518044 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 意圖 識別 方法 裝置 | ||
1.一種意圖識別方法,其特征在于,包括:
對待識別語句進行語義分析,從所述待識別語句中分別獲得與多個目標分類任務關聯的語義類別,所述多個目標分類任務關聯的語義類別至少包括實體類別、狀態類別和動作類別;
將獲得的各個語義類別組合成簡化后的待識別語句;
根據簡化后的待識別語句,確定所述待識別語句的意圖類別;
所述對待識別語句進行語義分析,從所述待識別語句中分別獲得與多個目標分類任務關聯的語義類別,具體包括:
基于已訓練的句子簡化模型,以所述待識別語句為輸入,依次通過所述句子簡化模型的輸入層,對所述待識別語句的各分詞進行編碼,獲得所述各分詞的詞向量表示和位置向量表示;
將所述各分詞的詞向量表示和位置向量表示進行拼接,并通過所述句子簡化模型的表示層和聚合層,根據所述待識別語句中各分詞的序列信息,獲得所述各分詞的隱藏編碼向量;
將所述各分詞的隱藏編碼向量,通過所述句子簡化模型的輸出層包含的實體分類模型中的平均池化層、全連接層,獲得所述待識別語句的實體類別;
將所述各分詞的隱藏編碼向量,通過所述輸出層包含的動作分類模型中的注意力機制模塊,獲得所述待識別語句的局部交叉信息,并通過所述動作分類模型中的全連接層,獲得所述待識別語句的動作類別;
將所述各分詞的隱藏編碼向量,通過所述輸出層包含的狀態分類模型中的注意力機制模塊,獲得所述待識別語句的局部交叉信息,并通過所述狀態分類模型中的全連接層,獲得所述待識別語句的狀態類別。
2.如權利要求1所述的方法,其特征在于,所述句子簡化模型的訓練方式,包括:
獲取訓練語句樣本集,其中,所述訓練語句樣本集中包括多個語句樣本,每個訓練語句樣本表示有實體類別、動作類別和狀態類別標注的語句樣本;
根據所述訓練語句樣本集,分別獲得所述訓練語句樣本集中語句樣本的各分詞的詞向量表示和位置向量表示,并根據所述各分詞的詞向量表示和位置向量表示,獲得所述各分詞的隱藏編碼向量,以及根據所述各分詞的隱藏編碼向量,識別出語句樣本屬于實體類別、動作類別和狀態類別的標記;
并根據識別出的語句樣本屬于實體類別、動作類別和狀態類別的標記和訓練語句樣本中標記的實體類別、動作類別和狀態類別,訓練句子簡化模型,直至所述句子簡化模型的損失函數收斂,獲得已訓練的句子簡化模型,其中,所述損失函數為識別出的實體類別、動作類別和狀態類別與語句樣本中標注的實體類別、動作類別和狀態類別之間的損失函數。
3.如權利要求2所述的方法,其特征在于,獲取訓練語句樣本集,具體包括:
獲得各訓練語句樣本,其中,所述各訓練語句樣本是根據預設的實體集、動作集和狀態集對語句進行標注后獲得的,所述實體集、動作集和狀態集是與業務知識庫關聯的;
對所述各訓練語句樣本進行重采樣,獲得訓練語句樣本集。
4.如權利要求1所述的方法,其特征在于,根據簡化后的待識別語句,確定所述待識別語句的意圖類別,具體包括:
基于已訓練的意圖分類模型,以所述簡化后的待識別語句為輸入參數,確定所述待識別語句對應的意圖類別。
5.如權利要求4所述的方法,其特征在于,進一步包括:
根據所述待識別語句對應的意圖類別,獲得與所述意圖類別相似度大于相似度閾值的關聯選項;
根據所述簡化的待識別語句,對獲得的關聯選項進行篩選,并將篩選出的關聯選項進行推薦。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010320457.6/1.html,轉載請聲明來源鉆瓜專利網。





