[發明專利]人機對話的回復生成方法和裝置有效
| 申請號: | 201711350420.2 | 申請日: | 2017-12-15 |
| 公開(公告)號: | CN108062388B | 公開(公告)日: | 2021-09-17 |
| 發明(設計)人: | 陳潮濤;李辰;姜迪;吳華;何徑舟 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/33 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 宋合成 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 人機對話 回復 生成 方法 裝置 | ||
1.一種人機對話的回復生成方法,其特征在于,包括以下步驟:
獲取人機對話中的用戶消息;
根據用戶消息,生成用于回復所述用戶消息的多個關鍵詞;
利用編碼器對所述多個關鍵詞進行編碼,得到所述多個關鍵詞的第一隱狀態;
根據所述多個關鍵詞的第一隱狀態,利用解碼器順序生成回復消息中各文本位置對應的多個第二隱狀態;其中,若當前文本位置不為首個文本位置,當前文本位置對應的第二隱狀態,是根據前一個文本位置對應的第二隱狀態和所述多個關鍵詞的第一隱狀態,計算得到當前文本位置的注意力分布后,根據所述注意力分布對所述多個關鍵詞的第一隱狀態進行加權平均得到當前文本位置的上下文向量,根據所述前一個文本位置對應的第二隱狀態和所述上下文向量,生成當前文本位置對應的第二隱狀態;
根據每一個第二隱狀態進行采樣,得到處于所述第二隱狀態對應文本位置上的詞匯;
根據各詞匯,以及各詞匯所處的文本位置,生成回復消息。
2.根據權利要求1所述的方法,其特征在于,所述根據每一個第二隱狀態進行采樣,得到處于所述第二隱狀態對應文本位置上的詞匯,包括:
針對第n個文本位置對應的第二隱狀態Sn,根據Sn,計算得到在第n個文本位置上的詞庫詞匯分布根據第n個文本位置的上下文向量Cn計算得到在第n個文本位置上符合所述詞庫詞匯分布的概率
根據注意力分布an,計算得到在第n個文本位置上的關鍵詞分布
根據所述概率對所述詞庫詞匯分布和所述關鍵詞分布進行加權計算,得到在第n個文本位置上詞匯預測分布on;
根據所述詞匯預測分布on,在所述詞庫中采樣,確定在第n個文本位置上的詞匯。
3.根據權利要求2所述的方法,其特征在于,所述根據所述概率對所述詞庫詞匯分布和所述關鍵詞分布進行加權計算,得到在第n個文本位置上詞匯預測分布on,包括:
將所述概率所述詞庫詞匯分布和所述關鍵詞分布代入公式計算得到在第n個文本位置上的詞匯預測分布on。
4.根據權利要求1所述的方法,其特征在于,所述根據所述多個關鍵詞的第一隱狀態,利用解碼器順序生成回復消息中各文本位置對應的多個第二隱狀態,包括:
若當前文本位置為所述回復消息的首個文本位置,將所述多個關鍵詞編碼得到的第一隱狀態輸入所述解碼器,得到當前文本位置對應的第二隱狀態。
5.根據權利要求1所述的方法,其特征在于,所述根據用戶消息,生成用于回復所述用戶消息的多個關鍵詞,包括:
根據所述用戶消息中的消息詞,計算所述消息詞與回復詞之間的點互信息;
根據點互信息,從回復詞中確定所述多個關鍵詞。
6.根據權利要求1所述的方法,其特征在于,所述根據用戶消息,生成用于回復所述用戶消息的多個關鍵詞,包括:
采用經過訓練的主題模型,根據用戶消息,確定用戶主題;
從所述用戶主題中,選取主題詞作為所述多個關鍵詞。
7.根據權利要求1所述的方法,其特征在于,所述根據用戶消息,生成用于回復所述用戶消息的多個關鍵詞,包括:
采用對話管理算法,對所述用戶消息進行分析,得到語義槽;
根據所述語義槽,確定所述多個關鍵詞。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711350420.2/1.html,轉載請聲明來源鉆瓜專利網。





