[發明專利]基于注意力機制的水軍評論檢測系統及方法在審
| 申請號: | 201911138610.7 | 申請日: | 2019-11-20 |
| 公開(公告)號: | CN110874397A | 公開(公告)日: | 2020-03-10 |
| 發明(設計)人: | 廖祥文;溫宇含;陳志豪;李曉濱;陳開志 | 申請(專利權)人: | 福州大學 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/35;G06K9/62;G06N3/04 |
| 代理公司: | 福州元創專利商標代理有限公司 35100 | 代理人: | 陳明鑫;蔡學俊 |
| 地址: | 350108 福建省福州市*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 注意力 機制 水軍 評論 檢測 系統 方法 | ||
本發明涉及一種基于注意力機制的水軍評論檢測系統及方法。包括文本特征處理模塊,用于將文本特征進行向量化處理并提取文本的離散特征進行歸一化處理;行為特征提取模塊,用于將行為特征進行向量化處理并進行歸一化處理;注意力機制權重計算模塊,用于計算歸一化后的文本特征、行為特征的注意力權重;集成學習模塊,將帶有權重的行為特征、文本特征作為輸入,用分類函數得到評論最終的分類結果。本發明提出的系統及方法能夠自動抽取出有效特征,并對特征進行抽象和組合,最終識別出分類結果。
技術領域
本發明涉及情感分析和觀點挖掘領域,特別是一種基于注意力機制的水軍評論檢測系統及方法。
背景技術
當前,有很多技術方法可用于水軍評論檢測。傳統的檢測方法單純的從單一特征的角度出發,很難確定獲取完整的特征信息。區別于傳統的特征提取方法,如何獲取完整的特征信息,進行針對水軍評論的檢測,是水軍評論檢測的問題關鍵。傳統的研究工作主要是基于文本特征或者用戶特征與文本特征簡單結合的方法,使用支持向量機(SVM)分類器進行分類。這一類基于特征工程與淺層線性模型的方法雖然取得了一定的成效,但是對訓練集樣本利用不充分,耗時耗力,并且影響效性以及模型的學習能力,故而其性能還有待提升。
當前,隨著深度學習的快速發展,基于自注意力機制的表示學習模型在語義表示與情感分析運用方面更具優勢。許多研究者們也將這些模型用于水軍評論的分類。這類方法首先將文本特征與行為特征分別提取出來,然后構建一個注意力機制模塊,定義行為特征,文本特征向量的權重值,將各個帶有權重的特征向量進行拼接,最后利用支持向量機對所樣本進行訓練建模。注意機制可以為每個訓練樣本學習文本和行為特征的動態權重,大幅度提升了信息的利用率。
當前,水軍評論方法未充分利用文本特征與行為特征的密切聯系,無法有效地挖掘出潛在的觀點信息。近年來,得到了國內外許多學者和研究機構的高度重視,水軍評論檢測分類利用了文本中不同信息,進行文本分類,能夠站在數據使用者的角度進行分析,提供更加細粒度的信息,有效提高水軍評論檢測的分析結果的準確程度,有助于研判人員更加了解人們對熱點話題、組織、產品等各種實體的真實觀點和看法,為研判人員提供更加有效而準確的信息。這就對水軍評論檢測技術提出了一個挑戰:如何構建一個有效的水軍評論檢測系統來滿足其需要。
發明內容
本發明的目的在于提供一種基于注意力機制的水軍評論檢測系統及方法,能夠自動抽取出有效特征,并對特征進行抽象和組合,最終識別出文本空間特征。
為實現上述目的,本發明的技術方案是:一種基于注意力機制的水軍評論檢測系統,包括:
文本特征處理模塊,用于將文本特征進行向量化處理并提取文本的離散特征進行歸一化處理;
行為特征提取模塊,用于將行為特征進行向量化處理并進行歸一化處理;
注意力機制權重計算模塊,用于計算歸一化后的文本特征、行為特征的注意力權重;
集成學習模塊,將帶有權重的行為特征、文本特征作為輸入,用分類函數得到評論最終的分類結果。
在本發明一實施例中,所述文本特征處理模塊將文本信息利用嵌套LSTM進行特征提取,并對文本的離散特征進行歸一化處理,將輸入的數據的信息用向量表示。
在本發明一實施例中,所述行為特征提取模塊將用戶行為信息進行歸一化處理,將輸入的數據的信息用向量表示。
在本發明一實施例中,所述集成學習模塊采用多層分類模型對輸入特征進行分類。
本發明還提供了一種基于注意力機制的水軍評論檢測方法,包括如下步驟:
步驟S1、將輸入的數據分為文本信息與行為信息,對文本信息、行為信息進行特征抽取分別獲得文本特征、行為特征,并將文本特征、行為特征進行向量化提取;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于福州大學,未經福州大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911138610.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:基于區塊鏈通證化溯源方法
- 下一篇:一種基于TPM的數字貨幣安全保護方法





