[發(fā)明專利]智能客服的語料構(gòu)建方法、裝置、計算機設備及存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 201910065779.8 | 申請日: | 2019-01-24 |
| 公開(公告)號: | CN109918486A | 公開(公告)日: | 2019-06-21 |
| 發(fā)明(設計)人: | 吳壯偉 | 申請(專利權(quán))人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/35;G06F16/951;G06Q30/02 |
| 代理公司: | 深圳市世聯(lián)合知識產(chǎn)權(quán)代理有限公司 44385 | 代理人: | 王鍇 |
| 地址: | 518000 廣東省深圳市福田區(qū)福*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 客服 語料 構(gòu)建 網(wǎng)絡爬蟲 應答數(shù)據(jù) 計算機設備 存儲介質(zhì) 生成模型 響應數(shù)據(jù) 智能 輸出 模型響應 智能化 命中率 應答 關(guān)聯(lián) 響應 | ||
1.一種智能客服的語料構(gòu)建方法,其特征在于,包括下述步驟:
獲取待構(gòu)建問答語料數(shù)據(jù)的主題詞;
將所述主題詞輸入到預先設定的問題生成模型中,獲取所述問題生成模型響應所述主題詞而輸出的問題列表;
將所述問題列表輸入到預先設定的第一網(wǎng)絡爬蟲模型中,獲取所述第一網(wǎng)絡爬蟲模型響應所述問題列表而輸出的響應數(shù)據(jù);
將所述響應數(shù)據(jù)作為所述問題列表的應答數(shù)據(jù),所述應答數(shù)據(jù)與所述問題列表關(guān)聯(lián)構(gòu)成所述主題詞的問答語料數(shù)據(jù)。
2.根據(jù)權(quán)利要求1所述的智能客服的語料構(gòu)建方法,其特征在于,在所述將所述主題詞輸入到預先設定的問題生成模型中,獲取所述問題生成模型響應所述主題詞而輸出的問題列表的步驟中,具體包括下述步驟:
將所述主題詞輸入到第二網(wǎng)絡爬蟲模型中,獲取所述第二網(wǎng)絡爬蟲模型響應所述主題詞而輸出的疑問候選數(shù)據(jù);
按照預設的匹配規(guī)則對所述疑問候選數(shù)據(jù)進行匹配,獲取疑問匹配數(shù)據(jù),其中所述匹配規(guī)則至少包含疑問語料匹配規(guī)則;
將所述疑問匹配數(shù)據(jù)作為所述主題詞的問題列表。
3.根據(jù)權(quán)利要求2所述的智能客服的語料構(gòu)建方法,其特征在于,在所述按照預設的匹配規(guī)則對所述疑問候選數(shù)據(jù)進行匹配的步驟中,所述匹配的步驟。
4.根據(jù)權(quán)利要求1所述的智能客服的語料構(gòu)建方法,其特征在于,在所述將所述主題詞輸入到預先設定的問題生成模型中,獲取所述問題生成模型響應所述主題詞而輸出的問題列表的步驟中,具體包括下述步驟:
將所述主題詞輸入到預先訓練的Seq2Seq模型中;
獲取所述Seq2Seq模型響應所述主題詞而輸出的問題列表。
5.根據(jù)權(quán)利要求1所述的智能客服的語料構(gòu)建方法,其特征在于,在所述將所述問題列表輸入到預先設定的第一網(wǎng)絡爬蟲模型中,獲取所述第一網(wǎng)絡爬蟲模型響應所述問題列表而輸出的響應數(shù)據(jù)的步驟之后,還包括下述步驟:
按照預設的過濾規(guī)則對所述響應數(shù)據(jù)進行過濾,獲取過濾數(shù)據(jù),其中,所述過濾規(guī)則至少包含疑問語料數(shù)據(jù)過濾規(guī)則;
將所述過濾數(shù)據(jù)作為所述問題列表的應答數(shù)據(jù)。
6.根據(jù)權(quán)利要求1所述的智能客服的語料構(gòu)建方法,其特征在于,在所述將所述問題列表輸入到預先設定的第一網(wǎng)絡爬蟲模型中,獲取所述第一網(wǎng)絡爬蟲模型響應所述問題列表而輸出的響應數(shù)據(jù)的步驟之后,還包括下述步驟:
將所述響應數(shù)據(jù)輸入到預先訓練的深度神經(jīng)網(wǎng)絡模型中,獲取所述深度神經(jīng)網(wǎng)絡模型輸出的對所述響應數(shù)據(jù)的分類信息,其中,所述分類信息至少將所述響應數(shù)據(jù)區(qū)分為疑問語料數(shù)據(jù)和非疑問語料數(shù)據(jù);
將所述非疑問語料數(shù)據(jù)作為所述問題列表的應答數(shù)據(jù)。
7.根據(jù)權(quán)利要求6所述的智能客服的語料構(gòu)建方法,其特征在于,所述預先訓練的深度神經(jīng)網(wǎng)絡模型是通過以下步驟進行訓練:
獲取標記有語料類別的訓練樣本,其中所述語料類別至少包含疑問語料和非疑問語料;
將所述訓練樣本輸入深度卷積神經(jīng)網(wǎng)絡模型獲取所述訓練樣本的參照語料類別;
比對所述訓練樣本內(nèi)不同樣本的參照語料類別與所述語料類別是否一致;
當參照語料類別與所述語料類別不一致時,反復循環(huán)迭代的更新所述深度神經(jīng)網(wǎng)絡模型中的權(quán)重,至所述參照語料類別與所述語料類別一致時結(jié)束。
8.一種智能客服的問答語料數(shù)據(jù)構(gòu)建裝置,其特征在于,包括:
獲取模塊,用于獲取待構(gòu)建問答語料數(shù)據(jù)的主題詞;
生成模塊,用于將所述主題詞輸入到預先設定的問題生成模型中,獲取所述問題生成模型響應所述主題詞而輸出的問題列表;
處理模塊,用于將所述問題列表輸入到預先設定的第一網(wǎng)絡爬蟲模型中,獲取所述第一網(wǎng)絡爬蟲模型響應所述問題列表而輸出的響應數(shù)據(jù),其中所述第一網(wǎng)絡爬蟲模型以所述問題列表為約束條件抓取目標數(shù)據(jù);
執(zhí)行模塊,用于將所述響應數(shù)據(jù)作為所述問題列表的應答數(shù)據(jù),所述應答數(shù)據(jù)與所述問題列表關(guān)聯(lián)構(gòu)成所述主題詞的問答語料數(shù)據(jù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于平安科技(深圳)有限公司,未經(jīng)平安科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910065779.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 構(gòu)建墊、實體圖像構(gòu)建物和構(gòu)建構(gòu)建物支撐件的方法
- 支持松耦合的軟件構(gòu)建方法、系統(tǒng)及該系統(tǒng)的實現(xiàn)方法
- 版本的構(gòu)建系統(tǒng)及方法
- 工程構(gòu)建系統(tǒng)及其構(gòu)建方法
- 實例構(gòu)建方法、裝置及軟件系統(tǒng)
- 軟件構(gòu)建方法、軟件構(gòu)建裝置和軟件構(gòu)建系統(tǒng)
- 天花板地圖構(gòu)建方法、構(gòu)建裝置以及構(gòu)建程序
- 一種項目構(gòu)建方法、持續(xù)集成系統(tǒng)及終端設備
- 并行構(gòu)建的方法、裝置及設備
- 構(gòu)建肺癌預測模型構(gòu)建方法
- 一種網(wǎng)絡爬蟲運行異常監(jiān)控方法和系統(tǒng)
- 一種監(jiān)控網(wǎng)絡爬蟲的方法、裝置和系統(tǒng)
- 一種通用的網(wǎng)絡爬蟲模型實現(xiàn)方法及系統(tǒng)
- 一種網(wǎng)絡爬蟲方法及系統(tǒng)
- 可視化網(wǎng)絡爬蟲方法及裝置
- 網(wǎng)絡爬蟲系統(tǒng)的測試方法及裝置、存儲介質(zhì)、電子設備
- 一種分布式爬蟲系統(tǒng)及其實現(xiàn)方法
- 網(wǎng)絡爬蟲平臺
- 網(wǎng)絡爬蟲的識別方法及裝置、計算機可讀存儲介質(zhì)
- 一種大數(shù)據(jù)防爬蟲處理方法及云平臺系統(tǒng)





