[發明專利]一種人機對話的拒絕識別方法、裝置、設備、介質有效
| 申請號: | 202010469831.9 | 申請日: | 2020-05-28 |
| 公開(公告)號: | CN111625636B | 公開(公告)日: | 2023-08-04 |
| 發明(設計)人: | 劉玉;李松如;文博;劉云峰 | 申請(專利權)人: | 深圳追一科技有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/35;G06F40/216;G06F40/279;G06F18/22;G06F18/241;G06N20/00;G10L15/22 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 劉曉菲 |
| 地址: | 518000 廣東省深圳市南山區粵海街道*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 人機對話 拒絕 識別 方法 裝置 設備 介質 | ||
本申請公開了一種人機對話的拒絕識別方法、裝置、設備、介質,該方法包括:獲取待識別的目標信息;利用至少一種相似度算法確定所述目標信息與預設FAQ知識庫的相似度;將所述目標信息輸入到預先訓練得到的FAQ分類模型,得到所述目標信息對應的最大類別概率;將所述相似度和所述最大類別概率輸入到預先訓練得到的拒識分類模型,得到所述目標信息對應的拒識類概率;根據所述拒識類概率確定是否拒絕識別所述目標信息。這樣能夠解決新增知識點未被訓練導致誤拒問題以及分類模型拒識范圍有限問題,提高拒絕識別的準確率。
技術領域
本申請涉及人工智能技術領域,特別涉及一種人機對話的拒絕識別方法、裝置、設備、介質。
背景技術
人機對話中,經常出現用戶輸入問句語義超出機器人知識庫支持范圍的情況。比如,用戶與訂餐機器人溝通,輸入了隨機字符“dsfdsa”等無語義問句,或輸入與當前訂餐業務無關的閑聊問句“今天會下雨嗎”,或輸入超出機器人業務范圍的問句“可以幫我訂張從沈陽去往北京的機票嗎”,那么機器人對此類無把握的問題拒絕識別,能減少錯誤回答,增強用戶體驗。
現有的人機對話中的拒絕識別一般采用以下兩種方式:一是采用文本分類模型或文本相似度模型,獲取用戶問句和知識庫所有知識點的類別概率或相似度,從獲取的多個相似度中選取最大的類別概率或相似度,若最大類別概率或最大相似度未超過預設閾值,則拒絕識別用戶問句;若超過預設閾值,則從知識庫獲取最大類別概率或最大相似度對應類別的知識點信息。二是在分類器新增“拒絕識別類”,如果用戶問句被分為拒絕識別類,則拒絕識別,否則,從知識庫獲取分類類別對應知識點回答。第一種方式中的分類模型方法和第二種方式,知識庫新增知識點是分類模型從未見過的類別,即該類別未在訓練集中出現,那么新增知識點相關的用戶問句容易被錯分到已知類別,且概率偏低,造成錯誤拒絕識別。且第一種方式中的文本相似度模型方法,對特征工程具有較強的依賴性,容易產生拒識準確率低問題。第二種方式,“拒絕識別類”的訓練語料有限,因而拒絕識別范圍有限。面對真實世界中成千上萬的業務無關問句,造成拒識率太低。
發明內容
有鑒于此,本申請的目的在于提供一種人機對話的拒絕識別方法、裝置、設備、介質,能夠解決新增知識點未被訓練導致誤拒問題以及分類模型拒識范圍有限問題,提高拒絕識別的準確率。其具體方案如下:
第一方面,本申請公開了一種人機對話的拒絕識別方法,包括:
獲取待識別的目標信息;
利用多種相似度算法分別確定所述目標信息與預設FAQ知識庫的多個不同維度的相似度;
將所述目標信息輸入到預先訓練得到的FAQ分類模型,得到所述目標信息對應的最大類別概率;
將所述多個不同維度的相似度和所述最大類別概率輸入到預先訓練得到的拒識分類模型,得到所述目標信息對應的拒識類概率;
根據所述拒識類概率確定是否拒絕識別所述目標信息。
可選地,所述獲取待識別的目標信息,包括:
獲取待識別的語音信息;
和/或,獲取待識別的文本信息。
可選地,所述根據所述拒識類概率確定是否拒絕識別所述目標信息,包括:
判斷所述拒識類概率是否小于預設拒識閾值;
如果所述拒識類概率大于或等于預設拒識閾值,則拒絕識別所述目標信息;
如果所述拒識類概率小于預設拒識閾值,則將輸出所述最大類別概率對應的目標知識點,其中,所述目標知識點為最大類別概率在所述預設FAQ知識庫中對應的知識點。
可選地,所述獲取待識別的目標信息之前,還包括:
利用預先獲取到的樣本訓練所述FAQ分類模型和所述拒識分類模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳追一科技有限公司,未經深圳追一科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010469831.9/2.html,轉載請聲明來源鉆瓜專利網。





