[發明專利]一種基于深度語義學習的智能客服實現方法及系統有效
| 申請號: | 202310838313.3 | 申請日: | 2023-07-10 |
| 公開(公告)號: | CN116561287B | 公開(公告)日: | 2023-09-22 |
| 發明(設計)人: | 張步林;熊林海;劉亮 | 申請(專利權)人: | 南京大全電氣研究院有限公司;大全集團有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/35;G06Q30/015;G06F16/33;G06F18/241 |
| 代理公司: | 北京中知法苑知識產權代理有限公司 11226 | 代理人: | 蔚湘瑩 |
| 地址: | 211100 江蘇省南*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 語義 學習 智能 客服 實現 方法 系統 | ||
1.一種基于深度語義學習的智能客服實現方法,其特征在于,包括:
構建問答對數據庫,所述問答對數據庫包含多組問答對數據,每組問答對數據中均包含問題和答案;
利用關鍵詞提取技術對問答對數據庫中,所有問答對數據的問題和答案進行關鍵詞提取,獲得問題關鍵詞和答案關鍵詞;
基于問答對數據庫,采用深度算法學習模型建立標簽分類器,包括:
按照以下方式建立初始的標簽分類器:
針對每個問答對數據,均基于相似度算法計算問題關鍵詞、答案關鍵詞與預設分類標簽的相似度,具體計算公式如下:
其中,simQ為問題關鍵詞和預設分類標簽的相似度值,simA為答案關鍵詞和預設分類標簽的相似度值,embQ和embA分別是問題關鍵詞和答案關鍵詞的bertSim詞嵌入向量,embC是預設分類標簽的bertSim詞嵌入向量;
按照以下公式,獲取每個問答對數據與每個分類標簽的相似度值simC:
其中,和分別為預設的權重值;
針對每個問答對數據,均將對應最大simC的分類標簽作為所述問答對數據的分類標簽;
利用問答對數據庫中的數據,設置訓練集和測試集,其中,問題和問題關鍵詞均作為訓練數據;
基于訓練集和測試集,采用Bert文本分類模型進行訓練,在模型準確率超過預設閾值時停止訓練,得到標簽分類器,所述標簽分類器能夠確定問題和答案的分類標簽;
根據用戶輸入的檢索問題,判斷是否觸發轉人工客服的條件,
如果是,將用戶轉接入人工客服;
如果否,提取檢索問題中的關鍵詞,并且,利用標簽分類器確定檢索問題的分類標簽;
根據檢索問題的關鍵詞和分類標簽,判斷問答對數據庫中是否存在最佳答案,
如果是,向用戶輸出最佳答案;
如果否,將檢索問題輸入預設的深度算法問答工具中獲取對應的答案,并將檢索問題和對應的答案發送至人工客服;
判斷是否接收到人工客服發送的轉接信息,
如果是,將用戶轉接入人工客服。
2.根據權利要求1所述的方法,其特征在于,所述根據用戶輸入的檢索問題,判斷是否觸發轉人工客服的條件,包括:
利用錯別詞校驗器對檢索問題進行校驗;
采用LAC分詞器對校驗后的檢索問題進行分詞,并去除停用詞;
對剩余的分詞進行組合,獲得檢索問題對應的文本數據;
判斷所述文本數據中包含的漢字數量是否不超過10,且文本數據中包含預設的轉人工關鍵詞,
如果是,確認觸發轉人工客服條件。
3.根據權利要求2所述的方法,其特征在于,所述提取檢索問題中的關鍵詞,并且,利用標簽分類器確定檢索問題的分類標簽,包括:
使用預設的深度算法問答工具對檢索問題的文本數據進行關鍵詞提取,獲取檢索關鍵詞列表;
根據文本數據和檢索關鍵詞列表,基于標簽分類器獲取檢索問題的分類標簽。
4.根據權利要求3所述的方法,其特征在于,所述根據檢索問題的關鍵詞和分類標簽,判斷問答對數據庫中是否存在最佳答案,包括:
利用標簽分類器確定問答對數據庫中,每一組問答對數據對應的分類標簽;
根據問題、問題關鍵詞和分類標簽,利用ES檢索,計算在問答對數據庫中,與檢索問題具有相同分類標簽的問答對數據與檢索問題之間的相似度得分;
選取相似度得分最高的前預設數量組問答對數據作為相似問答對;
判斷是否存在相似度得分超過預設閾值的相似問答對,
如果是,將相似度得分最高的一組相似問答對中的答案作為最佳答案。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京大全電氣研究院有限公司;大全集團有限公司,未經南京大全電氣研究院有限公司;大全集團有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310838313.3/1.html,轉載請聲明來源鉆瓜專利網。





