[發明專利]一種基于情感分析在線熱點事件跟蹤及分析的方法在審
| 申請號: | 201811454028.7 | 申請日: | 2018-11-30 |
| 公開(公告)號: | CN109582801A | 公開(公告)日: | 2019-04-05 |
| 發明(設計)人: | 孫華 | 申請(專利權)人: | 武漢推杰網絡科技有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F17/27 |
| 代理公司: | 上海精晟知識產權代理有限公司 31253 | 代理人: | 馮子玲 |
| 地址: | 430000 湖北省武漢市*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 熱點事件 情感分析 跟蹤 原始文本 分析 文本 檢索 分詞處理模塊 信息處理技術 用戶操作模塊 原始文本數據 關鍵詞識別 關鍵詞文本 輸入關鍵詞 準確度 詞義 分詞處理 分析系統 信息檢索 智能識別 情感化 分詞 局限 | ||
本發明公開了一種基于情感分析在線熱點事件跟蹤及分析的方法,具體包括以下步驟:S1、首先人們可通過用戶操作模塊將需要分析的熱點事件相關關鍵詞的原始文本輸入到整個分析系統內,然后通過原始文本分詞處理模塊對原始文本數據進行分詞處理得到分詞文本,本發明涉及信息處理技術領域。該基于情感分析在線熱點事件跟蹤及分析的方法,可很好的解決現有的關鍵詞識別和檢索太過于局限的問題,大大提高識別和檢索的準確度,實現了對人們輸入關鍵詞文本進行情感化智能識別,很好的達到了通過識別關鍵詞文本中情感文本,來準確的理解關鍵詞詞義的目的,從而大大方便了相關人員的信息檢索、跟蹤和分析工作。
技術領域
本發明涉及信息處理技術領域,具體為一種基于情感分析在線熱點事件跟蹤及分析的方法。
背景技術
大數據指無法在一定時間范圍內用常規軟件工具進行捕捉、管理和處理的數據集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產,從技術上看,大數據與云計算的關系就像一枚硬幣的正反面一樣密不可分,大數據必然無法用單臺的計算機進行處理,必須采用分布式架構,它的特色在于對海量數據進行分布式數據挖掘,但它必須依托云計算的分布式處理、分布式數據庫和云存儲、虛擬化技術,隨著云時代的來臨,大數據也吸引了越來越多的關注,大數據通常用來形容一個公司創造的大量非結構化數據和半結構化數據,這些數據在下載到關系型數據庫用于分析時會花費過多時間和金錢,大數據分析常和云計算聯系到一起,因為實時的大型數據集分析需要像MapReduce一樣的框架來向數十、數百或甚至數千的電腦分配工作,大數據需要特殊的技術,以有效地處理大量的容忍經過時間內的數據,大數據已經在人們日常生活中應用十分廣泛,例如實時新聞、電影、音樂和社交網絡等,都有十分廣泛的應用,而對于一些熱點事件進行檢索個跟蹤分析時,大多需要人們在大數據端口輸入熱點事件的關鍵詞進行檢索。
目前在根據人們輸入的熱點事件關鍵詞文本進行檢索時,大多只能識別人們輸入關鍵詞文本的數據類型進行檢索,然而,這樣的關鍵詞識別和檢索太過于局限,識別和檢索的準確度較低,不能實現對人們輸入關鍵詞文本進行情感化智能識別,無法達到通過識別關鍵詞文本中情感文本,來準確的理解關鍵詞詞義的目的,不能實現對熱點事件進行快速的鎖定、跟蹤和分析,從而給相關人員的信息檢索、跟蹤和分析工作帶來了極大的不便。
發明內容
(一)解決的技術問題
針對現有技術的不足,本發明提供了一種基于情感分析在線熱點事件跟蹤及分析的方法,解決了現有的關鍵詞識別和檢索太過于局限,識別和檢索的準確度較低,不能實現對人們輸入關鍵詞文本進行情感化智能識別,無法達到通過識別關鍵詞文本中情感文本,來準確的理解關鍵詞詞義的目的,不能實現對熱點事件進行快速的鎖定、跟蹤和分析的問題。
(二)技術方案
為實現以上目的,本發明通過以下技術方案予以實現:一種基于情感分析在線熱點事件跟蹤及分析的方法,具體包括以下步驟:
S1、首先人們可通過用戶操作模塊將需要分析的熱點事件相關關鍵詞的原始文本輸入到整個分析系統內,然后通過原始文本分詞處理模塊對原始文本數據進行分詞處理得到分詞文本,之后利用特征向量構建和訓練系統內的語義詞向量訓練模塊和情感詞向量訓練模塊分別對分詞文本進行語義詞向量和情感喜怒哀樂詞向量訓練,再利用特征向量構建和訓練系統內的詞典詞向量構建模塊和已有的情感詞典大數據庫進行詞典詞向量構建;
S2、然后系統處理模塊可控制情感詞向量處理系統內的初始輸入詞向量矩陣生成模塊分別生成語義詞向量、情感詞向量和詞典詞向量的分詞文本,從而得到三種類型初始輸入詞向量矩陣,再利用LSTM記憶網絡處理單元捕獲三種類型初始輸入詞向量矩陣中每一單詞的上下文語義,融入上下文信息,然后通過輸出詞向量矩陣生成模塊處理后得到三種類型輸出詞向量矩陣,輸出詞向量矩陣能夠消除單詞歧義;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢推杰網絡科技有限公司,未經武漢推杰網絡科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811454028.7/2.html,轉載請聲明來源鉆瓜專利網。





