[發明專利]評論質量的分類方法及裝置有效
| 申請號: | 201711429770.8 | 申請日: | 2017-12-26 |
| 公開(公告)號: | CN108153733B | 公開(公告)日: | 2021-07-09 |
| 發明(設計)人: | 劉小晗 | 申請(專利權)人: | 北京星選科技有限公司 |
| 主分類號: | G06F40/284 | 分類號: | G06F40/284;G06F40/216;G06K9/62 |
| 代理公司: | 北京智信四方知識產權代理有限公司 11519 | 代理人: | 呂雁葭 |
| 地址: | 100085 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 評論 質量 分類 方法 裝置 | ||
本發明實施方式提供了評論質量的分類方法及裝置,涉及計算機應用技術領域。其中,評論質量的分類方法包括:計算評論語句的文本特征值、情感特征值和有用性特征值;訓練AdaBoost分類器;調用所述AdaBoost分類器根據所述文本特征值、情感特征值和有用性特征值,對所述評論語句的質量進行分類。本發明所提供的方法不僅考慮到評論語句的文本特征,還考慮到評論語句的情感特征和有用性特征,此外,選擇Adaboost分類器(一種強分類器)進行分類,因此,可以更加準確地對評論語句的質量進行分類。
技術領域
本發明涉及計算機應用技術領域,更為具體而言,涉及評論質量的分類方法及裝置。
背景技術
互聯網和移動通訊的高速發展使得越來越多的消費者開始在網上購物。同時,消費者會在電子商務網站上不斷分享著自己對產品本身的評價。這種評價蘊含著豐富的客戶反饋信息,因此對于企業來說具有重要意義。評論中積極的客戶反饋可以有效推廣產品,但消極的反饋卻可能導致潛在消費者的流失。因此,高效理解產品評論中的客戶反饋并及時作出回應,不斷滿足客戶需求,對于謀求立足于競爭激烈的國際化市場的企業來說至關重要。但由于評論的質量不一,因此使得對評論的質量進行分類成為一項重要工作。
然而,在現有技術中,評論質量的分類方法存在分類準確率較低的問題,難以滿足當前企業對于評論語句的質量評估需求。
發明內容
在現有的解決方案中,僅考慮了評論語句的文本特征,而且雖然訓練了svm(Support Vector Machine,支持向量機)和貝葉斯兩種分類器,但由于這兩種分類器均屬于弱分類器,因此,評論質量的分類準確率仍然較低。
對此,本發明實施方式提供了評論質量的分類方法及裝置,用以解決現有技術中所存在的上述技術問題。
第一方面,本發明實施方式提供了一種評論質量的分類方法。
具體地,所述方法包括:
計算評論語句的文本特征值、情感特征值和有用性特征值;
訓練AdaBoost分類器;
調用所述AdaBoost分類器根據所述文本特征值、情感特征值和有用性特征值,對所述評論語句的質量進行分類。
在本實施方式中,不僅考慮到評論語句的文本特征,還考慮到評論語句的情感特征和有用性特征,此外,選擇Adaboost分類器(一種強分類器)進行分類,因此,可以更加準確地對評論語句的質量進行分類。
結合第一方面,在本發明的一些實施方式中,計算評論語句的文本特征值包括:
統計出所述評論語句中第一詞法元素的數量、第二詞法元素的數量和子句的數量;
根據所述第一詞法元素的數量、第二詞法元素的數量和子句的數量,計算所述文本特征值;
其中,所述第一詞法元素包括:與所述評論語句所針對的商品對象相關的名詞;
所述第二詞法元素包括:實詞。
結合第一方面,在本發明的一些實施方式中,計算評論語句的情感特征值包括:
從所述評論語句中識別出第三詞法元素;
基于情感詞典對所述第三詞法元素進行賦值;
判斷所述評論語句中是否存在用于修飾所述第三詞法元素的第四詞法元素;
若是,則基于所述情感詞典確定所述第四詞法元素的等級;
根據所述第三詞法元素的賦值、所述等級和與所述評論語句對應的評分情感得分,計算所述情感特征值;
其中,所述第三詞法元素包括:包含于所述情感詞典中的形容詞和動詞;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京星選科技有限公司,未經北京星選科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711429770.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種審訊筆錄的審查方法及裝置
- 下一篇:一種文本處理方法及裝置





