[發明專利]對話生成方法、裝置、設備及計算機可讀介質在審
| 申請號: | 201810694537.0 | 申請日: | 2018-06-29 |
| 公開(公告)號: | CN109002500A | 公開(公告)日: | 2018-12-14 |
| 發明(設計)人: | 連榮忠;彭金華;馬宗陽;姜迪;何徑舟 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京市鑄成律師事務所 11313 | 代理人: | 張臻賢;江宇 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語句信息 對話 計算機可讀介質 擴展信息 生成模型 回復 計算效率 時間消耗 行為數據 語句 搜索 查詢 輸出 | ||
本發明提出一種對話生成方法、裝置、設備及計算機可讀介質。所述對話生成方法,包括:獲取輸入的原始語句信息;根據所述原始語句信息在搜索行為數據中進行查詢,獲得所述原始語句信息的擴展信息;將所述原始語句信息和所述擴展信息輸入對話生成模型,通過所述對話生成模型輸出回復語句。本發明實施例可以提高計算效率,降低計算時間消耗,另外通過對輸入的語句信息進行擴展,可以增加回復生成的準確性。
技術領域
本發明涉及人工智能領域,尤其涉及一種基于檢索日記的對話生成方法及裝置、設備和計算機可讀介質。
背景技術
通用對話系統作為人工智能的重要場景,得到越來越多的關注,典型的工業界應用包括:聊天機器人、手機助手等。而在通用對話系統中,進行對話的生成是重要的一個環境,目前主流的方法包括兩種:檢索式和自然語言生成。檢索式的方法是通過用戶輸入的句子在語料中進行檢索,找到一些相關的回復,效果很受語料的限制,對應語料中沒有相關的句子則無法回復用戶。因此基于自然語言生成的方式越來越受到重視,使用的是端到端(end2end)的框架,最常用的為序列到序列(seq2seq,sequence to sequence)。但是使用自然語言生成的方式面臨著生成安全回復的重要問題,會生成一些沒有信息含量與上文沒有關聯的通用回復,例如:『我不知道啊』,『不錯不錯』。在實際應用中生成這些回復會嚴重影響用戶的體驗。
為了解決生成沒有信息含量和無關聯回復的問題,現有技術提出了在生成的過程中加入關鍵詞進行輔助,或者使用最大交互信息(Maximum Mutual Information,MMI)的方法對生成結果進行篩選。
然而,現有技術仍存在以下問題:
1、引入關鍵詞的方法主要的難點在于針對對話進行關鍵詞的抽取,這是一個相當難的問題,現階段沒有比較好的方法可以獲取到在對話上的關鍵詞。
2、使用MMI對結果進行篩選的則大大增加了整個流程的計算量,為了獲取滿足應用的效果可能需要消耗上千倍的時間,因此不滿足實際應用。
發明內容
本發明實施例提供一種對話生成方法、裝置、設備及計算機可讀介質,以解決或緩解現有技術中的一個或多個技術問題。
第一方面,本發明實施例提供了一種對話生成方法,包括:
獲取輸入的原始語句信息;
根據所述原始語句信息在搜索行為數據中進行查詢,獲得所述原始語句信息的擴展信息;
將所述原始語句信息和所述擴展信息輸入對話生成模型,通過所述對話生成模型輸出回復語句。
結合第一方面,本發明實施例在第一方面的第一種實施方式中,所述對話生成模型包括編碼器和解碼器,將所述原始語句信息和所述擴展信息輸入對話生成模型,通過所述對話生成模型輸出回復語句,包括:
將所述原始語句信息和所述擴展信息輸入編碼器,通過所述編碼器分別生成原始語句向量和擴展語句向量;
將所述原始語句向量和所述擴展語句向量輸入解碼器,通過所述解碼器生成回復語句。
結合第一方面的第一種實施方式,本發明實施例在第一方面的第二種實施方式中,將所述原始語句向量和所述擴展語句向量輸入解碼器,通過所述解碼器生成回復語句,包括:
將所述原始語句向量和所述擴展語句向量聯合作為所述解碼器的初始向量;
將所述初始向量作為所述解碼器的初始輸入,逐個生成所述回復語句的每個字。
結合第一方面的第一種實施方式,本發明實施例在第一方面的第三種實施方式中,將所述原始語句向量和所述擴展語句向量輸入解碼器,通過所述解碼器生成回復語句,包括:
將所述原始語句向量和所述擴展語句向量聯合作為所述解碼器的初始向量;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810694537.0/2.html,轉載請聲明來源鉆瓜專利網。





