[發(fā)明專利]問答數(shù)據(jù)處理方法、電子裝置及存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 201810135748.0 | 申請(qǐng)日: | 2018-02-09 |
| 公開(公告)號(hào): | CN108415980A | 公開(公告)日: | 2018-08-17 |
| 發(fā)明(設(shè)計(jì))人: | 于鳳英;王健宗;肖京 | 申請(qǐng)(專利權(quán))人: | 平安科技(深圳)有限公司 |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30;G06F17/27 |
| 代理公司: | 深圳市沃德知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
| 地址: | 518000 廣東省深*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 文本數(shù)據(jù) 坐席 匹配度 知識(shí)庫(kù) 存儲(chǔ)介質(zhì) 電子裝置 數(shù)據(jù)處理 記錄 時(shí)間順序排列 加權(quán)計(jì)算 特征權(quán)重 問題語句 預(yù)設(shè) 語句 數(shù)據(jù)庫(kù) 篩選 答案 節(jié)約 補(bǔ)充 更新 統(tǒng)計(jì) 維護(hù) | ||
本發(fā)明提供了一種問答數(shù)據(jù)處理方法,包括:從數(shù)據(jù)庫(kù)獲取坐席文本數(shù)據(jù),將所述坐席文本數(shù)據(jù)分為若干組問答記錄,按照記錄的時(shí)間順序排列每組問答記錄中的問題語句和答案語句,得到若干個(gè)候選問答對(duì),然后統(tǒng)計(jì)每個(gè)候選問答對(duì)的多個(gè)指定特征,針對(duì)每個(gè)候選問答對(duì)使用特征權(quán)重對(duì)所述多個(gè)指定特征進(jìn)行加權(quán)計(jì)算,得到每個(gè)候選問答對(duì)的匹配度,再根據(jù)所述匹配度從所有候選問答對(duì)中篩選出匹配度高于第二預(yù)設(shè)閾值的候選問答對(duì)作為目標(biāo)問答對(duì)補(bǔ)充到問答知識(shí)庫(kù)中。本發(fā)明還提供一種電子裝置及存儲(chǔ)介質(zhì)。利用本發(fā)明可以從坐席文本數(shù)據(jù)中選擇出合適的目標(biāo)問答對(duì),對(duì)問答知識(shí)庫(kù)進(jìn)行維護(hù)和更新,從而節(jié)約人力和提高效率。
技術(shù)領(lǐng)域
本發(fā)明涉及計(jì)算機(jī)技術(shù)領(lǐng)域,尤其涉及一種問答數(shù)據(jù)處理方法、電子裝置及存儲(chǔ)介質(zhì)。
背景技術(shù)
隨著科技的發(fā)展,人工智能(Artificial Intelligence,AI)正逐步改變著我們的生活方式,例如智能問答就是其中一種。當(dāng)客戶通過文字或語音在線咨詢時(shí),可以由線上的智能客服機(jī)器人或線上智能客服應(yīng)答系統(tǒng)為客戶進(jìn)行智能答復(fù)。智能問答可以有效緩解客戶服務(wù)的等待狀況,提升服務(wù)質(zhì)量,因而有著非常廣闊的前景。
目前,面向特定領(lǐng)域的智能問答的實(shí)現(xiàn)都需要有一個(gè)龐大的問答知識(shí)庫(kù),所述問答知識(shí)庫(kù)中包含大量設(shè)定的問題答案對(duì),例如問題是“保修期多久”,則相應(yīng)的答案為“保修期一年”,智能問答中客服即是基于所述問答知識(shí)庫(kù)進(jìn)行智能答復(fù)的。然而,為了保證答復(fù)的準(zhǔn)確性,需要及時(shí)補(bǔ)充完善問答知識(shí)庫(kù),而目前問答知識(shí)庫(kù)的維護(hù)耗費(fèi)著大量的人力資源,并且效率低下。
發(fā)明內(nèi)容
鑒于以上原因,有必要提供一種問答數(shù)據(jù)處理方法、電子裝置及存儲(chǔ)介質(zhì),可以自動(dòng)從坐席文本數(shù)據(jù)中選擇出合適的目標(biāo)問答對(duì),對(duì)問答知識(shí)庫(kù)進(jìn)行維護(hù)和更新,從而節(jié)約人力和提高效率。
為實(shí)現(xiàn)上述目的,本發(fā)明提供一種問答數(shù)據(jù)處理方法,該方法包括:獲取步驟:從數(shù)據(jù)庫(kù)獲取坐席文本數(shù)據(jù),所述坐席文本數(shù)據(jù)包括所有客戶與客服在問答過程中記錄的問答數(shù)據(jù);分組步驟:將所述坐席文本數(shù)據(jù)分為若干組問答記錄,同一組問答記錄屬于同一客戶和相應(yīng)的客服,每組問答記錄包括客戶的若干個(gè)問題語句和客服的若干個(gè)答案語句;排序步驟:按照記錄的時(shí)間順序排列每組問答記錄中的問題語句和答案語句,去除無相應(yīng)答案語句的問題語句和無相應(yīng)問題語句的答案語句,將每組問答記錄中的問題語句和答案語句排列為一問一答的形式,從而得到若干個(gè)候選問答對(duì),每個(gè)候選問答對(duì)包括一個(gè)問題語句和一個(gè)相應(yīng)的答案語句;提取步驟:對(duì)每個(gè)候選問答對(duì)中的問題語句和答案語句進(jìn)行分詞處理得到各個(gè)詞條,統(tǒng)計(jì)各詞條在所述坐席文本數(shù)據(jù)中出現(xiàn)的詞頻,根據(jù)所統(tǒng)計(jì)的各詞條的詞頻為相應(yīng)詞條計(jì)算詞條權(quán)重,將詞條權(quán)重大于第一預(yù)設(shè)閾值的詞條作為相應(yīng)問題語句或答案語句的關(guān)鍵詞;計(jì)算步驟:統(tǒng)計(jì)每個(gè)候選問答對(duì)的多個(gè)指定特征,對(duì)每個(gè)所述指定特征分別賦予相應(yīng)的預(yù)設(shè)特征權(quán)重,針對(duì)每個(gè)候選問答對(duì),使用所述特征權(quán)重對(duì)所述多個(gè)指定特征進(jìn)行加權(quán)計(jì)算,得到每個(gè)候選問答對(duì)的匹配度;篩選步驟:從所有候選問答對(duì)中篩選出匹配度高于第二預(yù)設(shè)閾值的候選問答對(duì)作為目標(biāo)問答對(duì),將所述目標(biāo)問答對(duì)補(bǔ)充到問答知識(shí)庫(kù)中,所述問答知識(shí)庫(kù)用于為客戶基于問答知識(shí)庫(kù)中的問答對(duì)進(jìn)行智能應(yīng)答。
可選地,所述從數(shù)據(jù)庫(kù)獲取坐席文本數(shù)據(jù)之后,還包括對(duì)所述坐席文本數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗操作,所述數(shù)據(jù)清洗操作包括:統(tǒng)計(jì)坐席文本數(shù)據(jù)中各語句的出現(xiàn)頻率,獲取出現(xiàn)頻率高于第三預(yù)設(shè)閾值的語句作為高頻語句;對(duì)每個(gè)所述高頻語句進(jìn)行分詞處理,統(tǒng)計(jì)分詞處理后得到的各詞條在所有高頻語句中的出現(xiàn)頻率,將出現(xiàn)頻率高于第四預(yù)設(shè)閾值的詞條作為寒暄詞;計(jì)算坐席文本數(shù)據(jù)各語句中所有寒暄詞在所屬語句所有詞條中的占比,將所計(jì)算出的占比高于第五預(yù)設(shè)閾值的語句作為寒暄類語句;確定坐席文本數(shù)據(jù)中的短文本語句,所述短文本語句包括字符數(shù)小于第六預(yù)設(shè)閾值的語句,以及只包含數(shù)字和/或符號(hào)的語句;從所述坐席文本數(shù)據(jù)中過濾掉所述寒暄類語句和所述短文本語句,從而完成所述數(shù)據(jù)清洗操作。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于平安科技(深圳)有限公司,未經(jīng)平安科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810135748.0/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種海面風(fēng)場(chǎng)反演中微波散射計(jì)數(shù)據(jù)搜索范圍的計(jì)算方法
- 下一篇:數(shù)據(jù)維度生成方法、裝置、設(shè)備以及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 一種韻律預(yù)測(cè)方法及系統(tǒng)
- 一種基于KNN技術(shù)的語料庫(kù)文本分類方法
- 文本數(shù)據(jù)標(biāo)注方法及裝置、存儲(chǔ)介質(zhì)、電子設(shè)備
- 數(shù)據(jù)采集方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 文本的處理、文本分類模型的訓(xùn)練方法及裝置
- 文本加密方法及裝置、終端設(shè)備、存儲(chǔ)介質(zhì)
- 文本數(shù)據(jù)處理方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 富文本數(shù)據(jù)處理方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 文本分類模型構(gòu)建、文本分類方法及裝置
- 文本匹配方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種實(shí)現(xiàn)客服業(yè)務(wù)的方法及客服系統(tǒng)
- 坐席登錄、調(diào)度的方法及坐席中心
- 一種呼叫中心分配坐席成功后系統(tǒng)報(bào)工號(hào)的處理方法和系統(tǒng)
- 一種聯(lián)絡(luò)中心進(jìn)行呼叫處理的方法、排隊(duì)機(jī)和聯(lián)絡(luò)中心
- 利用貝葉斯均值回歸(BMR)的呼叫映射系統(tǒng)和方法
- 坐席資源碼的分配方法和分配系統(tǒng)
- 坐席分配方法和裝置
- 坐席分配方法和裝置
- 專屬坐席池分配方法、電子裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 坐席轉(zhuǎn)接方法及裝置
- 一種專利文本自動(dòng)分析的系統(tǒng)及方法
- 基于知識(shí)的故障恢復(fù)支持系統(tǒng)
- 一種鐵磁諧振故障知識(shí)庫(kù)構(gòu)建方法
- 融合知識(shí)庫(kù)處理方法和裝置,以及知識(shí)庫(kù)管理系統(tǒng)
- 一種基于病理生理路徑的臨床知識(shí)庫(kù)系統(tǒng)
- 一種面向網(wǎng)絡(luò)安全的知識(shí)庫(kù)構(gòu)建方法
- 基于多知識(shí)庫(kù)推理的數(shù)據(jù)匹配決策方法及系統(tǒng)
- 一種語義知識(shí)庫(kù)構(gòu)建方法
- 基于人工智能的知識(shí)庫(kù)生成方法和智能機(jī)器人應(yīng)答方法
- 知識(shí)點(diǎn)存儲(chǔ)方法、裝置、服務(wù)器及介質(zhì)





