[發明專利]一種基于評分和中文情感分析的垃圾評論檢測方法無效
| 申請號: | 201310002969.8 | 申請日: | 2013-01-05 |
| 公開(公告)號: | CN103064971A | 公開(公告)日: | 2013-04-24 |
| 發明(設計)人: | 張衛豐;徐勝國;張迎周;周國強;王子元;周國富;錢小燕;許碧歡;陸柳敏 | 申請(專利權)人: | 南京郵電大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/27 |
| 代理公司: | 南京經緯專利商標代理有限公司 32200 | 代理人: | 葉連生 |
| 地址: | 210003 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 評分 中文 情感 分析 垃圾 評論 檢測 方法 | ||
1.一種基于評分和中文情感分析的垃圾評論檢測方法,其特征在于該方法所包含的步驟為:
步驟1)?輸入產品評論信息;
步驟2)?預處理產品評論信息:
步驟2.1)?生成評論信息語料庫;
步驟2.2)?提取語料庫的第一條評論信息;
步驟2.3)?判斷評論信息是否存在語料庫中,如果不存在,轉步驟2.10),否則,轉步驟2.4);
步驟2.4)?判斷該條評論信息是否含廣告信息,如果不含,轉步驟2.6),否則,轉步驟2.5);
步驟2.5)?刪除該條評論信息,轉步驟2.9);
步驟2.6)?切分評論信息;
步驟2.7)?獲取評論信息子句;
步驟2.8)?使用分詞軟件,分詞并標注詞性;
步驟2.9)?提取語料庫的下一條評論信息,轉步驟2.3);
步驟2.10)?輸出產品評論信息的處理結果;
步驟3)?輸入情感詞典;
步驟4)?輸入句型模式集;
步驟5)?根據情感詞典和句型模式集,提取對象詞,情感詞:
步驟5.1)?輸入一條評論信息;
步驟5.2)?初始化該評論信息;
步驟5.3)?獲取評論信息的子句集合;
步驟5.4)?提取第一條子句;
步驟5.5)?判斷子句是否存在于集合中,如果不存在,轉步驟5.13),否則,轉步驟5.6);
步驟5.6)?獲取情感詞典;
步驟5.7)?判斷該子句是否含情感詞,如果不含,轉步驟5.8),否則,轉步驟5.9);
步驟5.8)?保存子句于客觀句集合,轉步驟5.12);
步驟5.9)?保存子句于主觀句集合;
步驟5.10)?輸入句型模式集;
步驟5.11)?根據句型模式,提取集合:<對象詞,情感詞>;
步驟5.12)?獲取下一條子句,轉步驟5.5);
步驟5.13)?輸出集合:<對象詞,情感詞>;
步驟6)?分析評論信息的情感傾向:
步驟6.1)?輸入一條評論信息;
步驟6.2)?獲取評論信息的子句集合;
步驟6.3)?提取第一條子句;
步驟6.4)?判斷子句是否存在于集合中,如果不存在,轉步驟6.13),否則,轉步驟6.5);
步驟6.5)?獲取否定詞集詞典;
步驟6.6)?根據否定詞詞典,判斷該句是否包含否定詞,如果不包含,轉步驟6.8),否則,轉步驟6.7);
步驟6.7)?初始化否定詞的傾向值為-1;
步驟6.8)?獲取副詞集詞典;
步驟6.9)?根據副詞集詞典,判斷該句是否包含副詞,如果不包含,轉步驟6.11),否則,轉步驟6.10);
步驟6.10)?根據副詞集詞典,獲取副詞的強度等級值;
步驟6.11)?根據否定詞的傾向值、副詞的強度等級值、單詞的傾向值,計算子句傾向值;?
步驟6.12)?獲取下一條子句,轉步驟6.4);
步驟6.13)?計算該條評論信息的傾向值;?
步驟7)?根據評分和傾向值,獲取結果信息:
步驟7.1)?輸入一條評論傾向值;
步驟7.2)?獲取該評論的評分;
步驟7.3)?計算該產品的平均評分;
步驟7.4)?如果該條評論傾向值大于零且評分小于平均評分,或者該條評論傾向值小于零且評分大于平均評分,轉步驟7.5),否則,轉步驟7.6);
步驟7.5)?輸出結果:該評論為垃圾評論,轉步驟7.7);
步驟7.6)?輸出結果:該評論為正常評論,轉步驟7.7);
步驟7.7)?結束垃圾評論檢測。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京郵電大學,未經南京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310002969.8/1.html,轉載請聲明來源鉆瓜專利網。





