[發明專利]文本語義識別方法、裝置、計算機設備及存儲介質有效
| 申請號: | 202110218904.1 | 申請日: | 2021-02-26 |
| 公開(公告)號: | CN112949317B | 公開(公告)日: | 2022-10-11 |
| 發明(設計)人: | 沈越 | 申請(專利權)人: | 平安普惠企業管理有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F40/211;G06F40/117;G06K9/62 |
| 代理公司: | 深圳市世聯合知識產權代理有限公司 44385 | 代理人: | 汪琳琳 |
| 地址: | 518000 廣東省深圳市前海深港合作區前*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 語義 識別 方法 裝置 計算機 設備 存儲 介質 | ||
1.一種文本語義識別方法,其特征在于,包括下述步驟:
輸入檢測文本至預設基礎模型,經過所述預設基礎模型的編碼層輸出得到所述檢測文本的第一句向量;
輸入所述第一句向量至所述預設基礎模型的準入門,根據所述準入門輸出得到所述檢測文本的第二句向量,具體地,獲取當前準入門的篩選閾值,將大于等于該篩選閾值的第一句向量確定為第二句向量;
獲取所述檢測文本的干擾特征向量,根據所述干擾特征向量對所述第二句向量進行篩選,得到第三句向量,其中,
所述獲取所述檢測文本的干擾特征向量的步驟具體包括:
獲取預設的標準文本,根據預設匹配算法計算所述檢測文本和所述標準文本的文本相似度;
在所述文本相似度大于等于預設文本相似閾值時,確定所述檢測文本和所述標準文本匹配成功,獲取所述標準文本的標記文本向量,并將所述標記文本向量作為所述檢測文本的干擾特征向量,其中,
所述獲取所述標準文本的標記文本向量的步驟具體包括:
預先采集多個所述標準文本,根據所述預設基礎模型對每個所述標準文本進行意圖識別,得到預測識別結果;
獲取所述標準文本的真實識別結果,根據所述預測識別結果和所述真實識別結果,確定所述標準文本的標記文本向量,其中,
所述根據所述預測識別結果和所述真實識別結果,確定所述標準文本的標記文本向量的步驟具體包括:
確定所述標準文本的預測識別結果和所述真實識別結果是否一致,在所述預測識別結果和所述真實識別結果不一致時,將所述預測識別結果和所述真實識別結果不一致的標準文本作為第一文本,并將所述預測識別結果作為所述第一文本的標記結果;
獲取所述標準文本中預測識別結果和真實識別結果均為所述標記結果的第二文本,將所述第一文本的標記文本向量確定為所述第二文本的標記文本向量,其中,所述標記文本向量為所述標準文本的干擾特征向量,所述標記文本向量與所述標準文本被預先關聯存儲在數據庫中,所述標準文本的干擾特征向量為預先獲得的所述標準文本的干擾項;
獲取所述第三句向量的匹配意圖,并將所述第三句向量輸入所述預設基礎模型中的確定門中,根據所述確定門選取所述匹配意圖中的命中意圖,確定所述命中意圖為所述檢測文本的文本意圖。
2.根據權利要求1所述的文本語義識別方法,其特征在于,所述輸入檢測文本至預設基礎模型,經過所述預設基礎模型的編碼層輸出得到所述檢測文本的第一句向量的步驟具體包括:
輸入所述檢測文本至所述預設基礎模型的編碼層,基于所述編碼層對所述檢測文本進行位置編碼、分類編碼和嵌入編碼,得到所述檢測文本的第一句向量。
3.根據權利要求1所述的文本語義識別方法,其特征在于,所述獲取所述第三句向量的匹配意圖的步驟具體包括:
獲取預設的標準向量,計算所述第三句向量和所述標準向量的第一余弦相似度,選取所述第一余弦相似度大于等于第一預設相似度的標準向量為匹配向量;
獲取所述匹配向量的向量意圖,確定所述向量意圖為所述第三句向量的匹配意圖。
4.根據權利要求1所述的文本語義識別方法,其特征在于,所述根據所述確定門選取所述匹配意圖中的命中意圖的步驟具體包括:
根據所述確定門計算所述第三句向量和所述檢測文本的預設句向量的第二余弦相似度;
在所述第二余弦相似度大于等于第二預設相似度時,確定所述第三句向量與所述預設句向量匹配成功,并確定匹配成功的預設句向量對應的匹配意圖為所述命中意圖。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安普惠企業管理有限公司,未經平安普惠企業管理有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110218904.1/1.html,轉載請聲明來源鉆瓜專利網。





