[發明專利]人機對話的處理方法、裝置、存儲介質及電子設備在審
| 申請號: | 202211717630.1 | 申請日: | 2022-12-29 |
| 公開(公告)號: | CN116010572A | 公開(公告)日: | 2023-04-25 |
| 發明(設計)人: | 熊俊霖 | 申請(專利權)人: | 達闥科技(北京)有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06N3/04;G06N3/08;G06Q10/0639 |
| 代理公司: | 北京英創嘉友知識產權代理事務所(普通合伙) 11447 | 代理人: | 于濤 |
| 地址: | 102400 北京市房*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 人機對話 處理 方法 裝置 存儲 介質 電子設備 | ||
本公開涉及一種人機對話的處理方法、裝置、存儲介質及電子設備,涉及人工智能領域,該方法包括:獲取輸入的目標問題文本。通過召回模型獲取目標問題文本對應的多個候選應答文本。通過預先生成的文本確定模型從多個候選應答文本中確定目標問題文本對應的目標應答文本。本公開通過獲取多個候選應答文本,并從多個候選應答文本中確定目標問題文本對應的目標應答文本,不局限于單一的應答文本的獲取方式,能夠提高人機對話過程中應答的準確性和可靠型。
技術領域
本公開涉及人工智能領域,具體地,涉及一種人機對話的處理方法、裝置、存儲介質及電子設備。
背景技術
在人機對話領域,針對用戶發出的問題(query),通常情況下,機器人可以通過在預設的問答數據庫里面查找相似的query,并返回查找到的query的應答(answer),或者可以利用各種對話模型生成query的answer。但是無論是哪種方式,都可能會出現answer不能滿足用戶的query需求的問題,例如,答非所問、無意義的回答、冒犯性的回答等,導致人機對話的效果并不準確和可靠。
發明內容
本公開的目的是提供一種人機對話的處理方法、裝置、存儲介質及電子設備,用于提高人機對話的準確性和可靠性。
根據本公開實施例的第一方面,提供一種人機對話的處理方法,所述方法包括:
獲取輸入的目標問題文本;
通過召回模型獲取所述目標問題文本對應的多個候選應答文本;
通過預先生成的文本確定模型從所述多個候選應答文本中確定所述目標問題文本對應的目標應答文本。
可選地,所述通過預先生成的文本確定模型從所述多個候選應答文本中確定所述目標問題文本對應的目標應答文本包括:
將和所述多個候選應答文本,作為所述文本確定模型的輸入,得到所述文本確定模型輸出的所述目標應答文本。
可選地,所述通過預先生成的文本確定模型從所述多個候選應答文本中確定所述目標問題文本對應的目標應答文本包括:
將所述多個候選應答文本,作為所述文本確定模型的輸入,得到所述文本確定模型輸出的文本排序信息,所述文本排序信息表征所述多個候選應答文本的排列順序;
根據所述排列順序從所述多個候選應答文本中確定所述目標問題文本對應的目標應答文本。
可選地,所述根據所述排列順序從所述多個候選應答文本中確定所述目標問題文本對應的目標應答文本包括:
將排列順序最高的候選應答文本,作為所述目標應答文本。
可選地,所述文本確定模型是通過以下方式訓練得到的:
獲取訓練樣本數據,所述訓練樣本數據包括多個樣本應答文本和每個樣本應答文本對應的樣本排序信息,所述樣本排序信息是根據預設的排序規則確定的;
通過所述訓練樣本數據,對預設訓練模型進行訓練,得到所述文本確定模型。
可選地,所述召回模型包括第一召回通路、第二召回通路、第三召回通路中的至少一個;所述通過召回模型獲取所述目標問題文本對應的多個候選應答文本包括以下至少一種方式:
通過所述第一召回通路,獲取從預設的數據庫中確定的所述目標問題文本對應的候選應答文本;
通過所述第二召回通路,獲取預先訓練的文本應答模型輸出的所述目標問題文本對應的候選應答文本;
通過所述第三召回通路,獲取預設的候選應答文本。
可選地,所述方法還包括:
按照預設的篩選規則,對所述多個候選應答文本進行篩選,得到篩選后的候選應答文本;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于達闥科技(北京)有限公司,未經達闥科技(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211717630.1/2.html,轉載請聲明來源鉆瓜專利網。





