[發(fā)明專利]智能客服的語料構建方法、裝置、計算機設備及存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 201910065779.8 | 申請日: | 2019-01-24 |
| 公開(公告)號: | CN109918486A | 公開(公告)日: | 2019-06-21 |
| 發(fā)明(設計)人: | 吳壯偉 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/35;G06F16/951;G06Q30/02 |
| 代理公司: | 深圳市世聯(lián)合知識產(chǎn)權代理有限公司 44385 | 代理人: | 王鍇 |
| 地址: | 518000 廣東省深圳市福田區(qū)福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 客服 語料 構建 網(wǎng)絡爬蟲 應答數(shù)據(jù) 計算機設備 存儲介質(zhì) 生成模型 響應數(shù)據(jù) 智能 輸出 模型響應 智能化 命中率 應答 關聯(lián) 響應 | ||
本發(fā)明實施例公開了一種智能客服的語料構建方法、裝置、計算機設備及存儲介質(zhì),其中方法包括下述步驟:獲取待構建問答語料數(shù)據(jù)的主題詞;將所述主題詞輸入到預先設定的問題生成模型中,獲取所述問題生成模型響應所述主題詞而輸出的問題列表;將所述問題列表輸入到預先設定的第一網(wǎng)絡爬蟲模型中,獲取所述第一網(wǎng)絡爬蟲模型響應所述問題列表而輸出的響應數(shù)據(jù);將所述響應數(shù)據(jù)作為所述問題列表的應答數(shù)據(jù),所述應答數(shù)據(jù)與所述問題列表關聯(lián)構成所述主題詞的問答語料數(shù)據(jù)。其中,應答數(shù)據(jù)通過網(wǎng)絡爬蟲獲取真實的客服應答。本發(fā)明提高了語料構建的效率和質(zhì)量,也提高了智能客服的問題命中率,使客服人工智能化。
技術領域
本發(fā)明智能客服領域,尤其涉及一種智能客服的語料構建方法、裝置、計算機設備及存儲介質(zhì)。
背景技術
隨著人工智能技術的發(fā)展,智能客服系統(tǒng)也逐漸興起。智能客服不僅為企業(yè)與海量用戶之間建立起便捷的基于自然語言的溝通平臺,有效地提高了客服工作的效率,而且能夠為企業(yè)進行精細化管理提供直接來源于客戶信息。
智能客服通常基于既有問答數(shù)據(jù)庫才能提供客服功能,現(xiàn)有的智能客服,在建立問答數(shù)據(jù)庫時需要人工整理知識點,人工擴展用戶的問題點,最終生成問答數(shù)據(jù)庫中一問一答的數(shù)據(jù)。
但是,人工整理知識點和人工擴展用戶問題點的方法,費時費力,而且往往不能體現(xiàn)用戶真實的熱點問題,導致在使用過程中,用戶提問命中問答數(shù)據(jù)庫中的問題點的命中率低,使智能客服不能有效地解答用戶提問,影響用戶體驗。
發(fā)明內(nèi)容
本發(fā)明提供一種智能客服的語料構建方法、裝置、計算機設備及存儲介質(zhì),以解決智能客服構建問答語料庫費時費力的問題。
為解決上述技術問題,本發(fā)明提出一種智能客服的語料構建方法,包括如下步驟:
獲取待構建問答語料數(shù)據(jù)的主題詞;
將所述主題詞輸入到預先設定的問題生成模型中,獲取所述問題生成模型響應所述主題詞而輸出的問題列表;
將所述問題列表輸入到預先設定的第一網(wǎng)絡爬蟲模型中,獲取所述第一網(wǎng)絡爬蟲模型響應所述問題列表而輸出的響應數(shù)據(jù);
將所述響應數(shù)據(jù)作為所述問題列表的應答數(shù)據(jù),所述應答數(shù)據(jù)與所述問題列表關聯(lián)構成所述主題詞的問答語料數(shù)據(jù)。
可選地,在所述將所述主題詞輸入到預先設定的問題生成模型中,獲取所述問題生成模型響應所述主題詞而輸出的問題列表的步驟中,具體包括下述步驟:
將所述主題詞輸入到第二網(wǎng)絡爬蟲模型中,獲取所述第二網(wǎng)絡爬蟲模型響應所述主題詞而輸出的疑問候選數(shù)據(jù);
按照預設的匹配規(guī)則對所述疑問候選數(shù)據(jù)進行匹配,獲取疑問匹配數(shù)據(jù),其中所述匹配規(guī)則至少包含疑問語料匹配規(guī)則;
將所述疑問匹配數(shù)據(jù)作為所述主題詞的問題列表。
可選地,在所述按照預設的匹配規(guī)則對所述疑問候選數(shù)據(jù)進行匹配的步驟中,所述匹配的步驟具體采用正則匹配算法獲取疑問匹配數(shù)據(jù)。
可選地,在所述將所述主題詞輸入到預先設定的問題生成模型中,獲取所述問題生成模型響應所述主題詞而輸出的問題列表的步驟中,具體包括下述步驟:
將所述主題詞輸入到預先訓練的Seq2Seq模型中;
獲取所述Seq2Seq模型響應所述主題詞而輸出的問題列表。
可選地,在所述將所述問題列表輸入到預先設定的第一網(wǎng)絡爬蟲模型中,獲取所述第一網(wǎng)絡爬蟲模型響應所述問題列表而輸出的響應數(shù)據(jù)的步驟之后,還包括下述步驟:
按照預設的過濾規(guī)則對所述響應數(shù)據(jù)進行過濾,獲取過濾數(shù)據(jù),其中,所述過濾規(guī)則至少包含疑問語料數(shù)據(jù)過濾規(guī)則;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經(jīng)平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910065779.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種網(wǎng)絡爬蟲運行異常監(jiān)控方法和系統(tǒng)
- 一種監(jiān)控網(wǎng)絡爬蟲的方法、裝置和系統(tǒng)
- 一種通用的網(wǎng)絡爬蟲模型實現(xiàn)方法及系統(tǒng)
- 一種網(wǎng)絡爬蟲方法及系統(tǒng)
- 可視化網(wǎng)絡爬蟲方法及裝置
- 網(wǎng)絡爬蟲系統(tǒng)的測試方法及裝置、存儲介質(zhì)、電子設備
- 一種分布式爬蟲系統(tǒng)及其實現(xiàn)方法
- 網(wǎng)絡爬蟲平臺
- 網(wǎng)絡爬蟲的識別方法及裝置、計算機可讀存儲介質(zhì)
- 一種大數(shù)據(jù)防爬蟲處理方法及云平臺系統(tǒng)





