[發明專利]一種基于應用內實時數據的情感分析方法和系統在審
| 申請號: | 201910488327.0 | 申請日: | 2019-06-05 |
| 公開(公告)號: | CN110390097A | 公開(公告)日: | 2019-10-29 |
| 發明(設計)人: | 黃罡;李玲;姜海鷗;景翔;婁帥;崔磊 | 申請(專利權)人: | 北京大學(天津濱海)新一代信息技術研究院 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06F17/24;G06F16/33;G06F16/35;G06F16/9536;G06Q40/04 |
| 代理公司: | 北京辰權知識產權代理有限公司 11619 | 代理人: | 劉廣達 |
| 地址: | 300452 天津市濱海新*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 情感分析 實時數據 應用 預處理 計算機技術領域 數據預處理 實時采集 數據模型 不一致 融合 | ||
1.一種基于應用內實時數據的情感分析方法,其特征在于,具體包括以下步驟:
步驟一、實時采集在應用內的數據;
步驟二、對采集的數據進行預處理;
步驟三、對預處理后的數據進行情感分析;
步驟四、根據步驟三中情感分析獲取情感指數。
2.如權利要求1所述的一種基于應用內實時數據的情感分析方法,其特征在于,所述步驟二包括以下子步驟:
2.1詞性標注,使用混合標記算法對數據進行詞性標注成,使用結巴工具分詞;
2.2噪聲過濾,對分詞后的數據中無關噪聲進行過濾。
3.如權利要求1所述的一種基于應用內實時數據的情感分析方法,其特征在于,所述步驟三中,情感分析具體包括以下子步驟:
3.1詞向量生成,將預處理后的數據中每個詞映射成低維向量;
3.2構建句子表示,輸入詞向量,構建句子表示,保留文本的詞序和上下文語義信息,生成句子向量;
3.3情感極性輸出,經過語義處理后,將句子向量進行回歸計算,輸出兩個正面和負面情感。
4.如權利要求1所述的一種基于應用內實時數據的情感分析方法,其特征在于,所述步驟四中,情感指數的計算為:
其中,pos是該時間范圍內,正面情感評論數量,neg是該時間范圍內,負面情感評論數量。
5.如權利要求1、2、3或4所述的一種基于應用內實時數據的情感分析方法,其特征在于,所述步驟一包括以下子步驟:
1.1搭建手機云后臺環境,安裝相應APP,將手機中的APP注冊到API網關;使用APP搜索目標對象,點擊目標對象對應的討論區,抓取Trace控制文件,分析運行時模型并進行服務代碼開發;
1.2前端通過接口文檔調用特定接口服務,該調用請求首先經過API網關,API網關將請求分配到相應的手機;
1.3通過數據映射,從多個API組合中提取數據。
6.一種基于應用內實時數據的情感分析系統,其特征在于,包括實時數據采集模塊、預處理模塊、情感分析模塊、指數計算模塊;
實時數據采集模塊將APP注冊到API網關,可以從APP中提取評論的時間維度和文本數據;
預處理模塊包括詞性標注模塊、噪聲過濾模塊,詞性標注模塊將文本數據使用混合標記算法進行詞性標注,使用結巴工具分詞;噪聲過濾模塊對數據中無關噪聲進行過濾;
情感分析模塊包括詞向量生成模塊、句子表示模塊、情感極性輸出模塊,其中詞向量生成模塊將分詞后的文本數據映射成低維向量;句子表示模塊將低維詞向量矩陣構建句子表示,生成句子向量;情感極性輸出模塊將文本向量進行回歸計算,輸出兩個正面和負面情感;
情感指數模塊可以計算一段時間范圍內,某只股票的股評情感指數。
7.如權利要求6所述的一種基于應用內實時數據的情感分析系統,其特征在于,實時數據采集模塊為Yancloud Hub應用。
8.如權利要求6所述的一種基于應用內實時數據的情感分析系統,其特征在于,情感指數模塊對情感指數的計算為:
其中,pos是該時間范圍內,正面情感評論數量,neg是該時間范圍內,負面情感評論數量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京大學(天津濱海)新一代信息技術研究院,未經北京大學(天津濱海)新一代信息技術研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910488327.0/1.html,轉載請聲明來源鉆瓜專利網。





