[發明專利]一種基于滾動式協同訓練的虛假評論識別方法在審
| 申請號: | 202010523660.3 | 申請日: | 2020-06-10 |
| 公開(公告)號: | CN111666480A | 公開(公告)日: | 2020-09-15 |
| 發明(設計)人: | 王敬東;闞海濤;孟凡奇;李佳 | 申請(專利權)人: | 東北電力大學 |
| 主分類號: | G06F16/9532 | 分類號: | G06F16/9532;G06F16/35;G06K9/62 |
| 代理公司: | 西安合創非凡知識產權代理事務所(普通合伙) 61248 | 代理人: | 楊蕾 |
| 地址: | 132012 *** | 國省代碼: | 吉林;22 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 滾動式 協同 訓練 虛假 評論 識別 方法 | ||
1.一種基于滾動式協同訓練的虛假評論識別方法,其特征在于,包括:
獲取評論文本,根據所述評論文本確定評論文本內容特征;
獲取評論文本對應的評論者信息,根據所述評論者信息確定評論者行為特征;
根據評論文本內容特征和評論者行為特征進行虛假評論識別;
輸出虛假評論識別結果。
2.根據權利要求1所述的基于滾動式協同訓練的虛假評論識別方法,其特征在于,所述評論文本內容特征包括:語性特征、詞匯特征、情感特征和字符特征;
其中:
語性特征即段落向量,指文本深層次語義表示;
詞匯特征即詞性頻率,指文本中各詞性詞數與總詞數比值;
情感特征包括:情感評分一致性、情感強度和情感詞匯特征,所述情感詞匯特征指文本中正面與負面情感詞詞數與總詞數比值;
字符特征即評論文本長度;
根據所述評論的語性特征、詞匯特征、情感評分一致性、情感強度和情感詞匯特征和字符特征的特點提取該評論語性特征、詞匯特征、情感評分一致性、情感強度和情感詞匯特征和字符特征的特征值,并對該特征值進行歸一化處理,使其在區間[-1.0,1.0] 內。
3.根據權利要求2所述的基于滾動式協同訓練的虛假評論識別方法,其特征在于,所述詞性特征的提取方法見公式(1):
式中,表示形容詞個數,表示副詞個數,為表示評論的總詞數。
4.根據權利要求2所述的基于滾動式協同訓練的虛假評論識別方法,其特征在于,所述情感強度特征的提取方式為:
首先提取情感單元,利用語料庫和情感詞典,抽取指定詞性搭配模式的情感詞和上下文,構建三元搭配單元,三元情感單元定義為:
,其中u為情感單元,w為情感詞語,n為否定詞,adv為程度副詞;情感強度計算公式見式(2):
式中,表示評論文本的情感強度,Wj為評論句中情感詞,re為評論句,表示情感詞的極性,情感積極時值為1,相反為-1,表示程度副詞的權值,表示每個情感詞前的否定詞數量,無否定詞為0,若有奇數個否定詞則值為-1,偶數個否定詞值為1。
5.根據權利要求1所述的基于滾動式協同訓練的虛假評論識別方法,其特征在于,所述評論者行為特征包括:評分異常特征、數量異常特征和內容異常特征;
其中:
評分異常特征包括:
文本評分偏差,指該評分與該目標對象的平均評分的偏差;
評論者評分偏差,指該評論與評論者的平均評分的偏差;
極端評分,1星或5星評價;
數據異常特征指標包括:評論者日最大評論數、總評論數和評論頻繁度;所述評論頻繁度指評論者每日評論數同日平均評論數差值最大值;及
內容異常特征,指文本與該目標對象的所有文本相似度最大值;
根據所述文本評分偏差、評論者評分偏差、極端評分、評論者日最大評論數、總評論數、評論頻繁度和內容異常特征的特點分別提取所述文本評分偏差、評論者評分偏差、極端評分、評論者日最大評論數、總評論數、評論頻繁度和內容異常特征的特征值,并對所述文本評分偏差、評論者評分偏差、極端評分、評論者日最大評論數、總評論數、評論頻繁度和內容異常特征的特征值進行歸一化處理,使其在區間[-1.0,1.0] 內。
6.根據權利要求5所述的基于滾動式協同訓練的虛假評論識別方法,其特征在于,所述內容異常特征中文本相似度的提取方式為:先把兩條評論用Doc2Vec表征為80維的段落向量,文本相似度計算見公式(4):
式中,表示文本相似度特征值,為待測評論,為目標文本庫中的評論,遍歷目標庫,求得最大值作為文本相似度特征值。
7.根據權利要求5所述的基于滾動式協同訓練的虛假評論識別方法,其特征在于,所述評分異常特征中的文本評分偏差特征提取方法見公式(5):
式中,為文本評分偏差特征值,為該評論的評分等級,為該目標商品所有評分等級的平均值,為評級系統最大可能偏差。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東北電力大學,未經東北電力大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010523660.3/1.html,轉載請聲明來源鉆瓜專利網。





