[發明專利]機器人客服引導對話中選擇話術的方法和裝置在審
| 申請號: | 201910922999.8 | 申請日: | 2019-09-27 |
| 公開(公告)號: | CN110647621A | 公開(公告)日: | 2020-01-03 |
| 發明(設計)人: | 劉佳;王子豪;崔恒斌 | 申請(專利權)人: | 支付寶(杭州)信息技術有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332 |
| 代理公司: | 11309 北京億騰知識產權代理事務所(普通合伙) | 代理人: | 孫欣欣;周良玉 |
| 地址: | 310000 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 對話文本 對話 集合 策略模型 匹配 方法和裝置 對話流程 目標用戶 人工客服 最大匹配 輸出 梳理 配置 維護 | ||
1.一種機器人客服引導對話中選擇話術的方法,所述方法包括:
獲取機器人客服與目標用戶之間的已進行對話的第一對話文本;
將所述第一對話文本作為對話上文,以及將第一候選話術集合中的各話術分別作為所述對話上文的對話下文,依次輸入基于用戶和人工客服的歷史對話預先訓練的策略模型,通過所述策略模型輸出所述第一候選話術集合中的各話術與所述第一對話文本的各匹配得分;
從所述第一候選話術集合中選擇所述各匹配得分中的最大匹配得分對應的話術,將該話術作為機器人客服下一步輸出的話術。
2.如權利要求1所述的方法,其中,所述第一對話文本包括:至少一輪對話中的機器語句、用戶語句和對應的角色信息;所述角色信息用于指示機器語句或用戶語句。
3.如權利要求1所述的方法,其中,所述方法還包括:
利用訓練樣本對所述策略模型進行訓練,其中,所述訓練樣本的樣本輸入包括第二對話文本,所述訓練樣本的樣本標簽包括匹配和不匹配,所述第二對話文本基于用戶和人工客服的歷史對話產生,并且以客服語句為結束。
4.如權利要求3所述的方法,其中,所述訓練樣本包括樣本標簽為匹配的正樣本,以及樣本標簽為不匹配的負樣本;所述正樣本和所述負樣本的數量相等。
5.如權利要求4所述的方法,其中,所述正樣本通過如下方式獲取:
針對用戶和人工客服的第一歷史多輪對話,將所述第一歷史多輪對話拆分為多組原始對話,所述多組原始對話中各組對話以客服語句作為結束,將所述各組對話分別作為所述第二對話文本,以得到多組正樣本。
6.如權利要求5所述的方法,其中,所述將所述第一歷史多輪對話拆分為多組原始對話,包括:
將所述第一歷史多輪對話分別拆分為前一輪對話、前兩輪對話至所述第一歷史多輪對話,拆分輪數依次遞增一輪,得到與所述第一歷史多輪對話的輪數相同數目的多組原始對話。
7.如權利要求4所述的方法,其中,所述負樣本通過如下方式獲?。?/p>
針對用戶和人工客服的第二歷史多輪對話,將所述第二歷史多輪對話拆分為多組原始對話,所述多組原始對話中各組對話以客服語句作為結束;
從第二候選話術集合中按照預定方式選擇目標話術;
將所述各組對話中結束的客服語句用所述目標話術進行替換,得到各組構造對話;
將所述各組構造對話分別作為所述第二對話文本,以得到多組負樣本。
8.如權利要求7所述的方法,其中,所述第二候選話術集合為從用戶和人工客服的歷史對話中篩選的人工客服的對話文本。
9.如權利要求1所述的方法,其中,所述策略模型為二分類模型。
10.一種機器人客服引導對話中選擇話術的裝置,所述裝置包括:
獲取單元,用于獲取機器人客服與目標用戶之間的已進行對話的第一對話文本;
匹配單元,用于將所述獲取單元獲取的第一對話文本作為對話上文,以及將第一候選話術集合中的各話術分別作為所述對話上文的對話下文,依次輸入基于用戶和人工客服的歷史對話預先訓練的策略模型,通過所述策略模型輸出所述第一候選話術集合中的各話術與所述第一對話文本的各匹配得分;
輸出單元,用于從所述第一候選話術集合中選擇所述匹配單元輸出的各匹配得分中的最大匹配得分對應的話術,將該話術作為機器人客服下一步輸出的話術。
11.如權利要求10所述的裝置,其中,所述第一對話文本包括:至少一輪對話中的機器語句、用戶語句和對應的角色信息;所述角色信息用于指示機器語句或用戶語句。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于支付寶(杭州)信息技術有限公司,未經支付寶(杭州)信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910922999.8/1.html,轉載請聲明來源鉆瓜專利網。





