[發(fā)明專利]投訴文本的分類模型、構(gòu)建方法、系統(tǒng)、分類方法和系統(tǒng)在審
| 申請?zhí)枺?/td> | 201811324875.1 | 申請日: | 2018-11-08 |
| 公開(公告)號: | CN109376226A | 公開(公告)日: | 2019-02-22 |
| 發(fā)明(設(shè)計)人: | 楊穎;周海芹;王珺;陳楊楠;余本功;曹雨蒙 | 申請(專利權(quán))人: | 合肥工業(yè)大學(xué) |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/35 |
| 代理公司: | 北京潤平知識產(chǎn)權(quán)代理有限公司 11283 | 代理人: | 劉兵;肖冰濱 |
| 地址: | 230001 安*** | 國省代碼: | 安徽;34 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 文本 投訴 分類模型 特征向量 主題向量 詞向量 構(gòu)建 分類 預(yù)處理 讀取 預(yù)處理模塊 分類結(jié)果 文本分類 分類器 拼接 | ||
本發(fā)明實施方式提供一種投訴文本的分類模型、構(gòu)建方法、系統(tǒng)、分類方法和系統(tǒng),屬于文本分類技術(shù)領(lǐng)域。所述分類模型包括:預(yù)處理模塊,用于讀取所述投訴文本,并對所述投訴文本進(jìn)行預(yù)處理;BTM模塊,用于對所述投訴文本進(jìn)行處理以生成主題向量;Doc2vec模塊,用于對所述投訴文本進(jìn)行處理以生成詞向量;將所述主題向量和所述詞向量進(jìn)行拼接以生成特征向量;ER分類器,用于根據(jù)所述特征向量對所述投訴文本進(jìn)行分類以生成分類結(jié)果。
技術(shù)領(lǐng)域
本發(fā)明涉及文本分類技術(shù)領(lǐng)域,具體地涉及一種投訴文本的分類模型、構(gòu)建方法、系統(tǒng)、分類方法和系統(tǒng)。
背景技術(shù)
目前移動通信運營商進(jìn)行投訴處理的方法主要是以客戶為導(dǎo)向構(gòu)建投訴管理體系、優(yōu)化投訴處理流程、增加客服的服務(wù)渠道或者采用在線客服等。技術(shù)支撐部門接到投訴工單后,由經(jīng)驗豐富的技術(shù)專家進(jìn)行診斷,分析引起投訴的原因,給出相應(yīng)的處理意見,并交由相關(guān)的網(wǎng)絡(luò)建設(shè)或維護(hù)部門進(jìn)行處理,同時將處理意見以工單回復(fù)的形式反饋給客服中心。因此,在移動通信質(zhì)量投訴問題的分析和診斷方面,還主要依賴于技術(shù)專家的經(jīng)驗和知識,采用人工處理方式。
為改善這一情況,電信企業(yè)應(yīng)在處理投訴問題前對投訴內(nèi)容進(jìn)行預(yù)分類,判斷投訴問題是否由服務(wù)原因所致,若是服務(wù)問題,應(yīng)及時改進(jìn),若是用戶自身原因?qū)е碌模瑒t應(yīng)及時提醒用戶,方便其發(fā)現(xiàn)問題的真實原因所在。不過問題的歸類卻對投訴受理人員提出了很高的要求,由于很多受理人員并沒有親身實踐過問題的處理過程,僅憑用戶的表達(dá)很難確定問題的類別,而一旦做出了錯誤歸類,這將會增加問題處理人員的負(fù)擔(dān)。
近年來,人工智能方法在處理客戶投訴方面有一些應(yīng)用,少量文獻(xiàn)提出采用文本挖掘和人工智能算法建立投訴識別系統(tǒng),對投訴熱點進(jìn)行智能分類,從而保證在短時間內(nèi)將投訴熱點分類到正確的投訴導(dǎo)航上去。現(xiàn)有的短文本分類方法主要是利用外部語料庫或附加信息豐富文本內(nèi)容來處理稀疏問題。對于投訴短文本,很難通過外部語料對文本進(jìn)行擴展,而客戶投訴文本長度短,數(shù)量大,則對文本表示的維度提出了要求。在以往的研究中,文本特征提取通常使用TF-IDF(Term Frequency-Inverse Document Frequency,詞頻-逆文本頻率指數(shù))算法或者LDA(Latent DirichletAllocation,潛在狄利克雷分布)主題模型,文本分類通常采用SVM方法,使用TF-IDF算法構(gòu)建SVM分類器的輸入向量存在向量維度過高,分類效率低等特點。
發(fā)明內(nèi)容
本發(fā)明實施方式的目的是提供一種投訴文本的分類模型、構(gòu)建方法、系統(tǒng)、分類方法和系統(tǒng),該投訴文本的分類模型可以提高投訴文本分類的準(zhǔn)確性;該構(gòu)建方法、系統(tǒng)可以構(gòu)建出分類準(zhǔn)確性更高的分類模型;該分類方法、系統(tǒng)可以提高更加準(zhǔn)確的對投訴文本進(jìn)行分類。
為了實現(xiàn)上述目的,本發(fā)明實施方式提供一種投訴文本的分類模型,所述分類模型包括:
預(yù)處理模塊,用于讀取所述投訴文本,并對所述投訴文本進(jìn)行預(yù)處理;
BTM模塊,用于對所述投訴文本進(jìn)行處理以生成主題向量;
Doc2vec模塊,用于對所述投訴文本進(jìn)行處理以生成詞向量;
將所述主題向量和所述詞向量進(jìn)行拼接以生成特征向量;
ER分類器,用于:
根據(jù)所述特征向量對所述投訴文本進(jìn)行分類以生成分類結(jié)果。
本發(fā)明的另一方面提供一種投訴文本的分類模型的構(gòu)建方法,用于構(gòu)建上述所述的分類模型,所述構(gòu)建方法包括:
初始化分類模型;
獲取投訴文本和所述投訴文本的真實分類結(jié)果;
對所述投訴文本進(jìn)行預(yù)處理;
采用BTM模型對所述投訴文本進(jìn)行處理以生成主題向量,其中所述主題向量的維度為N1維;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于合肥工業(yè)大學(xué),未經(jīng)合肥工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811324875.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 使用大型數(shù)據(jù)庫進(jìn)行對象識別的系統(tǒng)及方法
- 一種圖像分類方法及裝置
- 分類模型訓(xùn)練方法及裝置
- 文本分類號的確定方法、裝置以及電子設(shè)備
- 文本分類方法、裝置、設(shè)備及計算機可讀存儲介質(zhì)
- 圖像分類模型的訓(xùn)練、圖像分類方法、裝置、設(shè)備及介質(zhì)
- 基于深度學(xué)習(xí)的圖像分類方法、裝置、服務(wù)器及介質(zhì)
- 模型生成方法、文本分類方法、裝置、設(shè)備及介質(zhì)
- 一種數(shù)據(jù)分類方法、裝置及系統(tǒng)
- 一種從局部到整體感知的電網(wǎng)場景預(yù)警分類方法及系統(tǒng)





