[發明專利]人機對話方法、設備和存儲介質有效
| 申請號: | 202011507159.4 | 申請日: | 2020-12-18 |
| 公開(公告)號: | CN112487173B | 公開(公告)日: | 2021-09-10 |
| 發明(設計)人: | 雷澤陽;徐俊;牛正雨;吳華;王海峰 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/33;G06F40/216;G06F40/30;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 韓?;?/td> |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 人機對話 方法 設備 存儲 介質 | ||
1.一種人機對話方法,包括:
獲取當前輸入語句以及對應的上文對話信息,并確定所述當前輸入語句對應的對話類型;
根據所述對話類型,從預先構建的圖譜中,確定出所述當前輸入語句所對應的第一目標節點以及與所述第一目標節點對應的多個第一鄰居節點;
獲取所述多個第一鄰居節點所對應的多個第一知識片段;
根據所述上文對話信息與所述多個第一知識片段之間的多個語義相關度,從所述多個第一知識片段中選擇出目標知識片段;
根據所述目標知識片段以及所述上文對話信息,生成所述當前輸入語句對應的回復語句。
2.根據權利要求1所述的方法,其中,所述根據所述上文對話信息與所述多個第一知識片段之間的多個語義相關度,從所述多個第一知識片段中選擇出目標知識片段,包括:
將所述上文對話信息輸入到預先訓練好的語義表示模型中,以得到所述上文對話信息的語義表示向量;
將所述多個第一知識片段分別輸入到所述語義表示模型中,以得到所述多個第一知識片段分別對應的多個語義表示向量;
根據所述上文對話信息的語義表示向量以及所述多個第一知識片段分別對應的多個語義表示向量,生成所述上文對話信息與所述多個第一知識片段之間的多個語義相關度;
根據所述多個語義相關度,從所述多個第一知識片段中選擇出目標知識片段。
3.根據權利要求2所述的方法,所述根據所述上文對話信息的語義表示向量以及所述多個第一知識片段分別對應的多個語義表示向量,生成所述上文對話信息與所述多個第一知識片段之間的多個語義相關度,包括:
針對每個第一知識片段,將所述上文對話信息的語義表示向量以及所述第一知識片段的語義表示向量輸入到預先訓練好的先驗網絡中,以得到所述上文對話信息與所述第一知識片段的語義相關度。
4.根據權利要求3所述的方法,其中,所述語義表示模型和所述先驗網絡是通過下述步驟訓練得到的:
獲取訓練數據,其中,所述訓練數據包括樣本語句、所述樣本語句對應的樣本回復、多個樣本知識片段以及上文對話樣本;
通過初始的語義表示模型分別得到所述樣本語句、樣本回復以及所述多個樣本知識片段各自對應的語義表示向量;
將多個第二知識片段各自對應的語義表示向量以及所述樣本語句對應的語義表示向量輸入到初始的先驗網絡中,以得到在所述樣本語句的條件下每個所述第二知識片段的概率;
將所述多個第二知識片段各自對應的語義表示向量以及所述樣本回復對應的語義表示向量輸入到初始的后驗網絡中,以得到在所述樣本回復的條件下每個所述第二知識片段的概率;
根據在所述樣本語句的條件下每個所述第二知識片段的概率以及在所述樣本回復的條件下每個所述第二知識片段的概率,對所述語義表示模型、所述先驗網絡以及所述后驗網絡進行訓練。
5.根據權利要求4所述的方法,其中,所述多個樣本知識片段是通過下述步驟得到的:
根據所述樣本語句對應的對話類型,從所述圖譜中獲取所述樣本語句所對應的第二目標節點以及與所述第二目標節點對應的多個第二鄰居節點;
獲取所述多個第二鄰居節點所對應的多個第二知識片段,并將所獲取的多個第二知識片段作為所述多個樣本知識片段。
6.根據權利要求1所述的方法,其中,所述根據所述目標知識片段以及所述上文對話信息,生成所述當前輸入語句對應的回復語句,包括:
獲取與所述對話類型對應的對話生成模型;
將所述目標知識片段以及所述上文對話信息輸入到所述對話生成模型中,以得到包括所述目標知識片段的回復語句。
7.根據權利要求6所述的方法,其中,所述對話生成模型通過以下步驟訓練得到:
獲取與所述對話類型對應的訓練數據,其中,所述訓練數據包括樣本語句以及所述樣本語句對應的上文對話樣本、樣本知識、樣本回復;
將所述上文對話樣本以及所述樣本知識輸入到初始的對話生成模型中,以得到所述樣本語句對應的預測回復;
根據所述預測回復以及所述樣本回復,對所述對話生成模型進行訓練。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011507159.4/1.html,轉載請聲明來源鉆瓜專利網。





