[發明專利]意圖識別方法、裝置、計算機設備及存儲介質在審
| 申請號: | 202210044795.0 | 申請日: | 2022-01-14 |
| 公開(公告)號: | CN114528844A | 公開(公告)日: | 2022-05-24 |
| 發明(設計)人: | 任俊松;侯曉龍 | 申請(專利權)人: | 中國平安人壽保險股份有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06K9/62;G06F16/332 |
| 代理公司: | 深圳眾鼎專利商標代理事務所(普通合伙) 44325 | 代理人: | 譚果林 |
| 地址: | 518000 廣東省深圳市福田區益田路5033號*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 意圖 識別 方法 裝置 計算機 設備 存儲 介質 | ||
本發明公開了一種意圖識別方法,應用于人工智能技術領域,用于提高未知意圖的識別準確率。本發明提供的方法包括:根據預設的正負向分類方法對所述樣本標簽數據進行分類,得到至少一個輸入文本對;將所述輸入文本對輸入到預設好的預訓練模型中進行訓練,得到初始語義表征模型;將輸入到初始語義表征模型得到的樣本向量進行聚類,得到聚類指數和聚類意圖標簽數據,并根據所述聚類指數和聚類意圖標簽數據得到語義表征模型;將待識別文本數據和樣本標簽數據輸入到所述語義表征模型,得到預測語義向量和驗證語義向量;計算所述預測語義向量與所述驗證語義向量之間的相似度結果,并根據所述相似度結果識別所述待識別文本數據中的未知意圖。
技術領域
本發明涉及人工智能技術領域,尤其涉及意圖識別方法、裝置、計算機 設備及存儲介質。
背景技術
隨著社會信息化,基于自然語言處理的智能客服、聊天機器人以及搜索 引擎等基于意圖識別技術的應用開始廣泛使用。
傳統的意圖識別方法一般通過構建意圖識別模型,在構建過程中,需要 標注大量語料,并基于已經劃分歸類好的意圖標簽,將意圖是被任務轉換為 分類任務,使用基于機器學習或者深度學習的模型,實現對輸入的意圖標簽 進行分類,實現意圖識別的目的。這種方法通常需要大量的標注數據,并且, 在實際應用場景中,由于實際意圖的復雜性和多樣性,會將一些意圖識別成 未知意圖,造成在應用場景中的意圖識別效果準確程度不高。
發明內容
本發明提供一種意圖識別方法、裝置、計算機設備及存儲介質,以提高 未知意圖的識別準確率。
一種意圖識別方法,包括:
從預設的數據庫中獲取樣本標簽數據和樣本無標簽數據,根據預設的正 負向分類方法對所述樣本標簽數據進行分類,得到至少一個輸入文本對;
將所述輸入文本對輸入到預設的預訓練模型中進行訓練,得到初始語義 表征模型;
將所述樣本標簽數據輸入到所述初始語義表征模型,得到樣本標簽向量, 將所述樣本無標簽數據輸入到所述初始語義表征模型,得到樣本無標簽向量;
根據預設的聚類方法,對所述樣本標簽向量和所述樣本無標簽向量進行 聚類,得到聚類指數和聚類意圖標簽數據,其中,所述聚類意圖標簽數據包 括聚類文本和聚類意圖標簽數據;
基于所述聚類指數,通過所述聚類意圖標簽數據訓練所述初始語義表征 模型,得到訓練好的語義表征模型;
從用戶端獲取用戶輸入的待識別文本數據,將所述待識別文本數據輸入 到所述訓練好的語義表征模型,得到預測語義向量,將所述樣本標簽數據輸 入到所述訓練好的語義表征模型,得到驗證語義向量;
通過所述聚類指數,根據匈牙利算法,計算所述預測語義向量與所述驗 證語義向量之間的相似度結果,并根據所述相似度結果識別所述待識別文本 數據中的未知意圖。
一種意圖識別裝置,包括:
數據獲取模塊,用于從預設的數據庫中獲取樣本標簽數據和樣本無標簽 數據,根據預設的正負向分類方法對所述樣本標簽數據進行分類,得到至少 一個輸入文本對;
初始模型訓練模塊,用于將所述輸入文本對輸入到預設的預訓練模型中 進行訓練,得到初始語義表征模型;
樣本向量生成模塊,用于將所述樣本標簽數據輸入到所述初始語義表征 模型,得到樣本標簽向量,將所述樣本無標簽數據輸入到所述初始語義表征 模型,得到樣本無標簽向量;
聚類模塊,用于根據預設的聚類方法,對所述樣本標簽向量和所述樣本 無標簽向量進行聚類,得到聚類指數和聚類意圖標簽數據,其中,所述聚類 意圖標簽數據包括聚類文本和聚類意圖標簽數據;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國平安人壽保險股份有限公司,未經中國平安人壽保險股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210044795.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種服務器故障硬盤自動定位系統、方法及裝置
- 下一篇:3D存儲器及其控制方法





