[發(fā)明專利]一種真實(shí)場景下用戶與客服對話的數(shù)據(jù)分析方法在審
| 申請?zhí)枺?/td> | 201811589984.6 | 申請日: | 2018-12-25 |
| 公開(公告)號: | CN109783623A | 公開(公告)日: | 2019-05-21 |
| 發(fā)明(設(shè)計(jì))人: | 楊燕;張琪;陳成才;郁建峰;戰(zhàn)蕾;李蕓;賀樑 | 申請(專利權(quán))人: | 華東師范大學(xué);上海智臻智能網(wǎng)絡(luò)科技股份有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/35;G06F16/34;G06F17/27;G06K9/62 |
| 代理公司: | 上海藍(lán)迪專利商標(biāo)事務(wù)所(普通合伙) 31215 | 代理人: | 徐筱梅;張翔 |
| 地址: | 200241 *** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 客服系統(tǒng) 數(shù)據(jù)分析 真實(shí)場景 客服 場景描述信息 非結(jié)構(gòu)化數(shù)據(jù) 工作效率高 場景信息 對話文本 關(guān)鍵信息 會話數(shù)據(jù) 文本分析 用戶會話 有效挖掘 句段 文檔 對話 抽取 分析 文本 智能 挖掘 便利 優(yōu)化 網(wǎng)絡(luò) | ||
本發(fā)明公開了一種真實(shí)場景下用戶與客服對話的數(shù)據(jù)分析方法,其特點(diǎn)是在原始會話數(shù)據(jù)中抽取用戶會話的意圖和重要句段,并將不同表述的相同意圖聚集在一起進(jìn)行文本摘要,得到同一意圖的場景描述信息。本發(fā)明與現(xiàn)有技術(shù)相比具有從文檔中提取表達(dá)整篇文章關(guān)鍵信息的部分,為后續(xù)的文本分析提供了極大地便利,場景信息分析正確,有效挖掘和分析大量非結(jié)構(gòu)化數(shù)據(jù),為智能客服系統(tǒng)提供了有效的解決方案,工作效率高,尤其是對網(wǎng)絡(luò)客服系統(tǒng)的對話文本挖掘,提出了一個(gè)十分有效的優(yōu)化方法,具有廣泛的實(shí)用意義。
技術(shù)領(lǐng)域
本發(fā)明涉及文本挖掘技術(shù)領(lǐng)域,尤其是一種基于文本聚類和文本挖掘的真實(shí)場景下用戶與客服對話的數(shù)據(jù)分析方法。
背景技術(shù)
客服部門在日常運(yùn)營過程中,會產(chǎn)生大量的非結(jié)構(gòu)化的文本數(shù)據(jù),這些數(shù)據(jù)中往往蘊(yùn)含了用戶對企業(yè)產(chǎn)品最真實(shí)的反饋數(shù)據(jù),客服部門在日常工作中,投入了大量的人力進(jìn)行人工回復(fù)和分析。在知識爆炸的時(shí)代,人們每天都需要面對海量數(shù)據(jù),合理利用信息,高效地處理文本提取有用的信息就變得極為重要。文本聚類是自然語言處理中的一項(xiàng)重要技術(shù),它主要將大量文本語料通過機(jī)器處理,自動分成若干類別。作為一種無監(jiān)督的機(jī)器學(xué)習(xí)方法,文本聚類技術(shù)不需要預(yù)先對文檔手工標(biāo)注類別,因此具有較強(qiáng)的靈活性和自動化處理能力。文本聚類已經(jīng)成為對文本信息進(jìn)行有效地挖掘、摘要提取的重要手段,所以利用文本摘要技術(shù)能夠從文檔中提取表達(dá)整篇文章關(guān)鍵信息的部分,為后續(xù)的文本分析提供了極大地便利,有望提升該類數(shù)據(jù)的分析與挖掘能力,不僅有望降低人工回復(fù)、分析和客服部門的日常運(yùn)營成本,還能大大提升公司產(chǎn)品設(shè)計(jì)的優(yōu)化水平。
現(xiàn)有技術(shù)的客服系統(tǒng)存在的問題是人工回復(fù)和分析,不但浪費(fèi)了大量的人力資源,而且運(yùn)營成本高,效率低。
發(fā)明內(nèi)容
本發(fā)明的目的是針對現(xiàn)有技術(shù)的不足而設(shè)計(jì)的一種真實(shí)場景下用戶與客服對話的數(shù)據(jù)分析方,采用意圖聚類以及會話摘要技術(shù),從文檔中提取表達(dá)整篇文章關(guān)鍵信息的部分,有效挖掘和分析大量非結(jié)構(gòu)化數(shù)據(jù),對真實(shí)場景下用戶與客服的對話進(jìn)行分析,得到同一意圖的場景描述信息,為智能客服系統(tǒng)提供了有效的解決方案,場景信息分析正確,工作效率高,尤其是對客服系統(tǒng)中對話文本挖掘的探索與實(shí)踐,為后續(xù)的文本分析提供了極大地便利,提出了一個(gè)十分有效的優(yōu)化方法,具有廣泛的實(shí)用意義。
本發(fā)明的目的是這樣實(shí)現(xiàn)的:一種真實(shí)場景下用戶與客服對話的數(shù)據(jù)分析方法,其特點(diǎn)是采用文本聚類和文本摘要技術(shù),對真實(shí)場景下用戶與客服的對話進(jìn)行分析,得到同一意圖的場景描述信息,其具體分析包括下述步驟:
a)、從原始會話數(shù)據(jù)中抽取用戶會話的意圖;
b)、從原始會話數(shù)據(jù)中抽取重要句段;
c)、對會話意圖進(jìn)行聚類;
d)、對有相同意圖的會話內(nèi)容進(jìn)行文本摘要,得到同一意圖下的場景描述。
所述抽取用戶會話的意圖是在用戶會話中抽取出用戶所表達(dá)的意圖,即用戶遇到的問題或者發(fā)起本輪會話的原因。
所述抽取重要句段是在會話中抽取出描述場景的關(guān)鍵句段,真實(shí)場景下的會話噪音繁多,為了增加后續(xù)數(shù)據(jù)分析的有效性,過濾掉噪音數(shù)據(jù)。
所述聚類是將不同表述的相同意圖聚集在一起。
所述文本摘要是對同一類意圖下的所有會話數(shù)據(jù)進(jìn)行文本摘要,得到同一意圖的場景描述信息。
本發(fā)明與現(xiàn)有技術(shù)相比具有從文檔中提取表達(dá)整篇文章關(guān)鍵信息的部分,為后續(xù)的文本分析提供了極大地便利,場景信息分析正確,有效挖掘和分析大量非結(jié)構(gòu)化數(shù)據(jù),為智能客服系統(tǒng)提供了有效的解決方案,工作效率高,尤其是對網(wǎng)絡(luò)客服系統(tǒng)中對話文本挖掘的探索與實(shí)踐,提出了一個(gè)十分有效的優(yōu)化方法,具有廣泛的實(shí)用意義。
附圖說明
圖1為本發(fā)明流程示意圖。
具體實(shí)施方式
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華東師范大學(xué);上海智臻智能網(wǎng)絡(luò)科技股份有限公司,未經(jīng)華東師范大學(xué);上海智臻智能網(wǎng)絡(luò)科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811589984.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 針對電信運(yùn)營商客服系統(tǒng)接入的物聯(lián)網(wǎng)客服中間件系統(tǒng)
- 一種基于云計(jì)算和網(wǎng)絡(luò)視頻會議的云客服平臺
- 基于客服系統(tǒng)的通信方法及系統(tǒng)
- 信息處理方法和裝置
- 一種基于MQTT和HTTP的智能客服系統(tǒng)及實(shí)現(xiàn)方法
- 一種基于云計(jì)算和網(wǎng)絡(luò)視頻會議的云客服平臺
- 電力在線客服客觀評價(jià)方法、系統(tǒng)及電力在線客服系統(tǒng)
- 一種客服功能接入方法和相關(guān)裝置
- 一種客服消息的轉(zhuǎn)發(fā)方法和裝置
- 一種在線客服交流系統(tǒng)及其控制方法
- 數(shù)據(jù)分析裝置、數(shù)據(jù)分析方法
- 用于工程改變數(shù)據(jù)分析的方法和系統(tǒng)
- 一種統(tǒng)一數(shù)據(jù)分析服務(wù)
- 數(shù)據(jù)分析方法、數(shù)據(jù)處理裝置和計(jì)算機(jī)可讀存儲介質(zhì)
- 數(shù)據(jù)分析應(yīng)用的管理方法、裝置、系統(tǒng)和存儲介質(zhì)
- 電力科研生產(chǎn)數(shù)據(jù)分析方法、裝置、系統(tǒng)及存儲介質(zhì)
- 數(shù)據(jù)分析方法及數(shù)據(jù)分析器
- 數(shù)據(jù)分析設(shè)備、數(shù)據(jù)分析方法和數(shù)據(jù)分析程序
- 一種大數(shù)據(jù)分析系統(tǒng)
- 一種數(shù)據(jù)分析方法、裝置、設(shè)備和存儲介質(zhì)
- 虛擬試穿試戴系統(tǒng)和虛擬試穿試戴方法
- 在虛擬場景中播放真實(shí)場景的方法及裝置
- 一種虛擬場景與真實(shí)場景融合的模型系統(tǒng)與方法
- 一種虛擬現(xiàn)實(shí)與真實(shí)場景融合的裝置
- 一種虛擬現(xiàn)實(shí)與真實(shí)場景融合的方法
- 虛擬場景與真實(shí)場景的數(shù)據(jù)交互方法、裝置、終端及系統(tǒng)
- 仿真場景構(gòu)建方法、裝置和終端
- 數(shù)據(jù)生成方法、裝置、服務(wù)器及存儲介質(zhì)
- 樣本生成方法、裝置、電子設(shè)備及存儲介質(zhì)
- 網(wǎng)絡(luò)靶場場景編排的真實(shí)設(shè)備快速接入系統(tǒng)與方法





