[發明專利]評論質量的分類方法及裝置有效
| 申請號: | 201711429770.8 | 申請日: | 2017-12-26 |
| 公開(公告)號: | CN108153733B | 公開(公告)日: | 2021-07-09 |
| 發明(設計)人: | 劉小晗 | 申請(專利權)人: | 北京星選科技有限公司 |
| 主分類號: | G06F40/284 | 分類號: | G06F40/284;G06F40/216;G06K9/62 |
| 代理公司: | 北京智信四方知識產權代理有限公司 11519 | 代理人: | 呂雁葭 |
| 地址: | 100085 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 評論 質量 分類 方法 裝置 | ||
1.一種評論質量的分類方法,其特征在于,所述方法包括:
計算評論語句的文本特征值、情感特征值和有用性特征值;
訓練AdaBoost分類器,在執行所述訓練的過程中,基于權重的設定閾值和與樣本數據分類結果的變化情況對應的權重更新規則,調整樣本數據的權重,
其中:
所述樣本數據分類結果的變化情況包括以下之一:上一輪分類結果錯誤,本輪分類結果正確;上一輪分類結果正確,本輪分類結果錯誤;上一輪分類結果錯誤,本輪分類結果錯誤;上一輪分類結果正確,本輪分類結果正確;
上一輪分類結果正確,本輪分類結果錯誤的樣本數據的權重增加幅度大于上一輪分類結果錯誤,本輪分類結果錯誤的樣本數據的權重增加幅度,上一輪分類結果正確,本輪分類結果正確的樣本數據的下降幅度大于上一輪分類結果錯誤,本輪分類結果正確的下降幅度;
調用所述AdaBoost分類器根據所述文本特征值、情感特征值和有用性特征值,對所述評論語句的質量進行分類。
2.如權利要求1所述的方法,其特征在于,計算評論語句的文本特征值包括:
統計出所述評論語句中第一詞法元素的數量、第二詞法元素的數量和子句的數量;
根據所述第一詞法元素的數量、第二詞法元素的數量和子句的數量,計算所述文本特征值;
其中,所述第一詞法元素包括:與所述評論語句所針對的商品對象相關的名詞;
所述第二詞法元素包括:實詞。
3.如權利要求2所述的方法,其特征在于,計算評論語句的情感特征值包括:
從所述評論語句中識別出第三詞法元素;
基于情感詞典對所述第三詞法元素進行賦值;
判斷所述評論語句中是否存在用于修飾所述第三詞法元素的第四詞法元素;
若是,則基于所述情感詞典確定所述第四詞法元素的等級;
根據所述第三詞法元素的賦值、所述等級和與所述評論語句對應的評分情感得分,計算所述情感特征值;
其中,所述第三詞法元素包括:包含于所述情感詞典中的形容詞和動詞;
所述第四詞法元素包括:包含于所述情感詞典中的副詞。
4.如權利要求3所述的方法,其特征在于,計算評論語句的情感特征值還包括:
若否,則根據所述第三詞法元素的賦值和與所述評論語句對應的評分情感得分,計算所述情感特征值。
5.如權利要求1所述的方法,其特征在于,計算評論語句的有用性特征值包括:
根據所述評論語句的有用性標注數量、回復量和評論發布者的等級,計算所述有用性特征值。
6.一種評論質量的分類裝置,其特征在于,所述裝置包括:
計算模塊,包括:用于計算評論語句的文本特征值的第一計算單元、用于計算所述評論語句的情感特征值的第二計算單元、和用于計算所述評論語句的有用性特征值的第三計算單元;
訓練模塊,用于訓練AdaBoost分類器,在執行所述訓練的過程中,基于權重的設定閾值和與樣本數據分類結果的變化情況對應的權重更新規則,調整樣本數據的權重,其中,所述樣本數據分類結果的變化情況包括以下至少一種:上一輪分類結果錯誤,本輪分類結果正確;上一輪分類結果正確,本輪分類結果錯誤;上一輪分類結果錯誤,本輪分類結果錯誤;上一輪分類結果正確,本輪分類結果正確,其中,上一輪分類結果正確,本輪分類結果錯誤的樣本數據的權重增加幅度大于上一輪分類結果錯誤,本輪分類結果錯誤的樣本數據的權重增加幅度,上一輪分類結果正確,本輪分類結果正確的樣本數據的下降幅度大于上一輪分類結果錯誤,本輪分類結果正確的下降幅度;
分類模塊,用于調用所述AdaBoost分類器根據所述文本特征值、情感特征值和有用性特征值,對所述評論語句的質量進行分類。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京星選科技有限公司,未經北京星選科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711429770.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種審訊筆錄的審查方法及裝置
- 下一篇:一種文本處理方法及裝置





