[發明專利]對話生成方法和裝置有效
| 申請號: | 201811541403.1 | 申請日: | 2018-12-17 |
| 公開(公告)號: | CN109800286B | 公開(公告)日: | 2021-05-11 |
| 發明(設計)人: | 彭金華;連榮忠;何徑舟;吳華 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33 |
| 代理公司: | 北京同立鈞成知識產權代理有限公司 11205 | 代理人: | 宋興;劉芳 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 對話 生成 方法 裝置 | ||
本申請實施例提供一種對話生成方法和裝置,該方法包括:從終端獲取當前提問;對于多個問答語句組中的每個問答語句組,獲取問答語句組中的回復語句的至少一個內容片段,并根據所述問答語句組中的提問語句和所述至少一個內容片段,得到一組問答對;所述問答語句組包括一個提問語句和所述提問語句對應的至少一個回復語句;根據多組問答對和所述當前提問,確定所述當前提問的回復;將所述當前提問的回復發送至所述終端。本申請實施例提供一種對話生成方法和裝置提高了生成的回復的精確度。
技術領域
本申請實施例涉及計算機技術領域,尤其涉及一種對話生成方法和裝置。
背景技術
對話生成技術是當前以及未來構建通用對話系統的一種主流技術,其本質是建模用戶當前的提問(query)與回復(response)的映射關系。
目前的對話生成方法包括兩種:檢索式和自然語言生成。檢索式的方法是通過用戶輸入的提問語句在語料中進行檢索,找到一些相關的回復,效果很受語料的限制,對應語料中沒有相關的句子則無法回復用戶。今年來基于自然語言生成的方式越來越受到重視,其使用的是端到端(end2end)的框架,最常用的為seq2seq,即將當前提問編碼后得到單一向量,然后依據這個向量去控制回復的生成。
上述方法都僅僅建模了提問與回復一對一的映射關系(即一個提問對應一種形式的答復),從而到導致生成的回復不夠精確,比如生成的回復不夠人性化,生成一些與提問沒有關聯的通用回復等。
發明內容
本申請實施例提供一種對話生成方法和裝置,使得生成的提問的回復比較精確。
第一方面,本申請實施例提供一種對話生成方法,包括:
從終端獲取當前提問;
對于多個問答語句組中的每個問答語句組,獲取問答語句組中的回復語句的至少一個內容片段,并根據所述問答語句組中的提問語句和所述至少一個內容片段,得到一組問答對;所述問答語句組包括一個提問語句和所述提問語句對應的至少一個回復語句;
根據多組問答對和所述當前提問,確定所述當前提問的回復;
將所述當前提問的回復發送至所述終端。
在一種可能的設計中,所述根據多組問答對和所述當前提問,確定當前提問的回復,包括:
根據多組問答對和所述當前提問,從多組問答對中對應的多個內容片段組中,確定與當前提問最相關的目標內容片段組;其中,每組問答對對應的至少一個內容片段組成一個內容片段組;
根據所述目標內容片段組和所述當前提問,確定所述當前提問的回復。
在一種可能的設計中,對于多個問答語句組中的每個問答語句組,獲取問答語句組中的回復語句的至少一個內容片段,并根據所述問答語句組中的提問語句和所述至少一個內容片段,得到一組問答對,包括:
對于語料庫對應的每個第一問答語句組,獲取第一問答語句組中的回復語句的至少一個第一內容片段,并根據所述第一問答語句組中的第一提問語句和至少一個第一內容片段,得到一組第一問答對;
對于每個第二問答語句組,獲取第二問答語句組中的回復語句的至少一個第二內容片段,并根據所述第二問答語句組中的第二提問語句和至少一個第二內容片段,得到一組第二問答對;
其中,第二問答語句組為所述終端對應的最近一次對話中的問答語句組。
在一種可能的設計中,所述根據多組問答對和所述當前提問,從多組問答對對應的多個內容片段組中,確定與當前提問最相關的目標內容片段組,包括:
根據多組第一問答對和所述當前提問,從多組第一問答對對應的多個第一內容片段組中確定與所述當前提問最相關的第一目標內容片段組;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811541403.1/2.html,轉載請聲明來源鉆瓜專利網。





