[發明專利]語句意圖識別方法、裝置、計算機設備及存儲介質有效
| 申請號: | 202110691968.3 | 申請日: | 2021-06-22 |
| 公開(公告)號: | CN113255351B | 公開(公告)日: | 2023-02-03 |
| 發明(設計)人: | 王涵暄;許雙華;蒙元;黃琳 | 申請(專利權)人: | 中國平安財產保險股份有限公司 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F40/211;G06F40/30;G06F18/22;G06F16/31 |
| 代理公司: | 深圳市明日今典知識產權代理事務所(普通合伙) 44343 | 代理人: | 王杰輝;熊成龍 |
| 地址: | 518000 廣東省深圳市福田區益田路*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語句 意圖 識別 方法 裝置 計算機 設備 存儲 介質 | ||
1.一種語句意圖識別方法,其特征在于,包括:
獲取待識別的語句;
對所述語句進行分詞,得到所述語句包含的關鍵詞;
基于預設的倒排索引對所述關鍵詞進行匹配,獲取所述關鍵詞映射的概念;所述預設的倒排索引包含關鍵詞與概念的索引關系,所述概念表示所述關鍵詞在語句的句式結構中的語義成分;
將所述概念通過預設的反向索引進行句式結構匹配,得到召回句式;所述預設的反向索引中包含句式結構與概念索引關系,且每個句式結構中包含多個不同的概念;所述召回句式為句式結構中包含了滿足預設匹配率的概念的句式結構;
根據所述概念包含的實體對所述召回句式進行詞語嵌入,得到相似問句;
計算所述相似問句與所述語句的相似度,選取相似度最高的相似問句作為所述語句的意圖識別結果;
所述對所述語句進行分詞,得到所述語句包含的關鍵詞之后,還包括:
從知識庫中獲取所述關鍵詞的同義詞;
所述基于預設的倒排索引對所述關鍵詞進行匹配,獲取所述關鍵詞映射的概念之后,還包括:
將所述同義詞映射為與所述關鍵詞相同的概念,以擴充所述概念映射的關鍵詞;
所述根據所述概念包含的實體對所述召回句式進行詞語嵌入,得到相似問句,包括:
將所述概念映射的所述關鍵詞,及所述關鍵詞的同義詞作為所述概念包含的實體;
將各個概念包含的實體填入到所述召回句式中對應的概念中對所述召回句式進行詞語嵌入,得到相似問句。
2.根據權利要求1所述的語句意圖識別方法,其特征在于,所述基于預設的倒排索引對所述關鍵詞進行匹配,獲取所述關鍵詞映射的概念之后,還包括:
根據各個所述概念的關聯度將所述概念進行組合,得到組合概念;
所述將所述概念通過預設的反向索引進行句式結構匹配,得到召回句式,包括:
將所述組合概念通過預設的反向索引進行句式結構匹配,得到召回句式;所述預設的反向索引中包含句式結構與組合概念索引關系,且每個句式結構中包含多個不同的概念及組合概念。
3.根據權利要求1所述的語句意圖識別方法,其特征在于,所述將所述概念通過預設的反向索引進行句式結構匹配,得到召回句式,包括:
獲取所述概念的個數,根據所述概念的個數計算所述語句的復雜度;
根據所述語句的復雜度確定匹配率,作為預設匹配率;
根據所述概念通過預設的反向索引進行句式結構匹配,得到召回句式;所述預設的反向索引中包含句式結構與概念索引關系,且每個句式結構中包含多個不同的概念;所述召回句式為句式結構中包含了滿足預設匹配率的概念的句式結構。
4.根據權利要求1所述的語句意圖識別方法,其特征在于,所述選取相似度最高的相似問句作為所述語句的意圖識別結果之后,還包括:
根據所述意圖識別結果,從知識庫中獲取所述語句的回復語句;
輸出所述回復語句。
5.根據權利要求1所述的語句意圖識別方法,其特征在于,所述根據所述概念包含的實體對所述召回句式進行詞語嵌入,得到相似問句,包括:
使用BERT算法模型根據所述概念包含的實體對所述召回句式進行詞語嵌入,得到相似問句。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國平安財產保險股份有限公司,未經中國平安財產保險股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110691968.3/1.html,轉載請聲明來源鉆瓜專利網。





