[發明專利]一種智能客服工單分類方法在審
| 申請號: | 202011194254.3 | 申請日: | 2020-10-30 |
| 公開(公告)號: | CN112287639A | 公開(公告)日: | 2021-01-29 |
| 發明(設計)人: | 趙友標 | 申請(專利權)人: | 上海中通吉網絡技術有限公司 |
| 主分類號: | G06F40/117 | 分類號: | G06F40/117;G06F40/216;G06F40/289;G06F40/30;G06F16/332;G06F16/35;G06K9/62 |
| 代理公司: | 北京細軟智谷知識產權代理有限責任公司 11471 | 代理人: | 付登云 |
| 地址: | 201799 上*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 智能 客服 分類 方法 | ||
1.一種智能客服工單分類方法,其特征在于,包括:
獲取客服與客戶的語音對話,將語音對話轉換成文本;
對所述文本進行數據清洗、詞處理和字處理,以得到待處理文本;
對所述待處理文本文本進行文本類別的標注;
將已標注的文本劃分為訓練集、驗證集和測試集,將所述訓練集、驗證集和測試集分別輸入到預設訓練模型中進行訓練,得到工單分類結果。
2.根據權利要求1所述的方法,其特征在于,對所述待處理文本文本進行文本類別的標注包括,
采用正則表達式將預設的文本類別與所述待處理文本進行匹配,根據匹配結果對所述文本進行文本類別的標注。
3.根據權利要求2所述的方法,其特征在于,所述預設的文本類別包括:快遞員離職、網點倒閉、網點爆倉、網點服務態度差和簽收未收。
4.根據權利要求1所述的方法,其特征在于,對所述文本進行數據清洗、分詞處理和詞向量處理,以得到待處理文本,包括:
對所述文本進行數據清洗,去掉所述文本中的停用詞、語氣詞和無用內容,所述無用內容包括問候語;
對經數據清洗處理后的文本進行詞處理和字處理,得到詞向量表示和字向量表示;
將所述詞向量與所述字向量表示表示進行嵌入,得到所述待處理文本。
5.根據權利要求4所述的方法,其特征在于,還包括對所述待處理文本進行二次清洗,包括:
按照正則表達判斷所述待處理文本中的詞向量與停用表是否相同,得到判斷結果;
若所述判斷結果為相同,則相同的詞向量從文本中移除;
若所述判斷結果為相同,則保留所述詞向量。
6.根據權利要求1所述的方法,其特征在于,在將已標注的文本劃分為訓練集、驗證集和測試集,將所述訓練集、驗證集和測試集分別輸入到預設訓練模型中進行訓練之前,還包括:
對所述待處理文本的文本長度進行處理,得到文本長度為512個字的已處理文本;
對所述已處理文本進行詞頻統計以及對所述已處理文本中每個字進行位置編碼,得到所述已處理文本語義上下文之間的聯系。
7.根據權利要求5所述的方法,其特征在于,對所述待處理文本的文本長度進行處理包括:對所述待處理文本長度超過512字的文本進行處理,和\或,對所述待處理文本長度小于512字的文本進行處理。
8.根據權利要求6所述的方法,其特征在于,對所述待處理文本長度超過512字的文本進行處理包括:
采用隨機數的形式對15%的文本采用保留頭部512個字;
對15%文本保留尾部512字;
對30%的文本保留中間512個字;
對剩下的文本分別保留頭部218個字和尾部294個字。
9.根據權利要求6所述的方法,其特征在于,對所述待處理文本長度小于512字的文本進行處理包括:
對所述待處理文本長度不足512個字的文本行的尾部進行零填充直到達到512個字。
10.根據權利要求6所述的方法,其特征在于,對所述已處理文本進行詞頻統計包括:詞組統計和單字統計。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海中通吉網絡技術有限公司,未經上海中通吉網絡技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011194254.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種熔模設備
- 下一篇:揚聲器的控制方法、控制裝置以及電子設備





