[發(fā)明專利]投訴預測方法及其模型建立方法、裝置以及相關設備在審
| 申請?zhí)枺?/td> | 202210107767.9 | 申請日: | 2022-01-28 |
| 公開(公告)號: | CN114676247A | 公開(公告)日: | 2022-06-28 |
| 發(fā)明(設計)人: | 王子奕;鞠劍勛;李健 | 申請(專利權)人: | 上海攜旅信息技術有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/211;G06F40/289;G06F40/30;G06N3/04;G06N3/08;G06Q30/02;G06Q50/14 |
| 代理公司: | 上海隆天律師事務所 31282 | 代理人: | 潘一諾 |
| 地址: | 201803 上海市嘉*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 投訴 預測 方法 及其 模型 建立 裝置 以及 相關 設備 | ||
1.一種投訴預測模型建立方法,其特征在于,包括:
設置所述投訴預測模型的預測的標簽集合;
獲取歷史客服對話文本以及歷史客服對話文本的標簽;
使用LTP語言處理工具對所述歷史客服對話文本進行分詞,生成詞掩碼序列以及句法依存關系圖;
使用BERT分詞器基于所述歷史客服對話文本,生成字令牌id序列、字位置id序列、字片段id序列以及字掩碼序列;
將所述字令牌id序列、字位置id序列、字片段id序列輸入模型編碼層,獲得所述歷史客服對話文本標識的用戶內容在字符維度的字特征序列;
將所述字特征序列和字掩碼序列轉換為設定尺寸,并基于所述字特征序列和字掩碼序列獲得詞特征序列;
將所述詞特征序列輸入至語法層的圖神經網絡,以感知所述詞特征序列的語法特征;
根據所述詞特征序列的語法特征以及詞掩碼序列輸出所述歷史客服對話文本的句子表示;
對所述句子表示執(zhí)行仿射變換以及歸一化處理,獲得所述投訴預測模型輸出的標簽的標簽概率分布;
將所述句子表示輸入至標簽混淆層,計算偽標簽概率分布;
根據所述偽標簽概率分布和所述標簽概率分布計算所述投訴預測模型的損失函數(shù);
迭代訓練所述投訴預測模型,以使得所計算的損失函數(shù)符合設定條件。
2.如權利要求1所述的投訴預測模型建立方法,其特征在于,所述獲取歷史客服對話文本以及歷史客服對話文本的標簽還包括:
設置所述歷史客服對話文本的最大詞數(shù)量;
設置所述歷史客服對話文本中的詞的最大字符數(shù)量。
3.如權利要求1所述的投訴預測模型建立方法,其特征在于,所述字特征序列為僅使用所述BERT分詞器的前6個輸出字符獲得的序列,輸入所述編碼層獲得的字特征序列。
4.如權利要求1所述的投訴預測模型建立方法,其特征在于,所述將所述字特征序列和字掩碼序列轉換為設定尺寸,并基于所述字特征序列和字掩碼序列獲得詞特征序列包括:
以所述字掩碼序列的字掩碼為權重,對單詞字符維度對單詞的各字符的特征求平均,獲得詞特征序列。
5.如權利要求1所述的投訴預測模型建立方法,其特征在于,所述語法層的圖神經網絡包括兩個多關系圖神經網絡層。
6.如權利要求5所述的投訴預測模型建立方法,其特征在于,所述投訴預測模型的損失函數(shù)為KL散度。
7.一種投訴預測方法,其特征在于,包括:
接收用戶輸入的對話文本;
根據所述對話文本,生成字令牌id序列、字位置id序列、字分段id序列、字掩碼序列以及句法依存關系圖;
將所述對話文本,生成字令牌id序列、字位置id序列、字分段id序列、字掩碼序列以及句法依存關系圖輸入如權利要求1至6任一項所述的投訴預測模型建立方法建立的投訴預測模型中;
獲取所述投訴預測模型預測的標簽的標簽概率分布;
將所述標簽概率分布中概率最高的標簽作為所述對話文本的預測標簽。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海攜旅信息技術有限公司,未經上海攜旅信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210107767.9/1.html,轉載請聲明來源鉆瓜專利網。





