[發明專利]一種社會事件網絡文本的輿情計算與推演方法及系統有效
| 申請號: | 202010841830.2 | 申請日: | 2020-08-20 |
| 公開(公告)號: | CN111984931B | 公開(公告)日: | 2022-06-03 |
| 發明(設計)人: | 王欣芝;彭艷;駱祥峰;劉楊;羅均;謝少榮;張丹 | 申請(專利權)人: | 上海大學 |
| 主分類號: | G06F17/18 | 分類號: | G06F17/18;G06N3/04;G06N3/08;G06Q50/00 |
| 代理公司: | 北京高沃律師事務所 11569 | 代理人: | 張夢澤 |
| 地址: | 200444*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 社會 事件 網絡 文本 輿情 計算 推演 方法 系統 | ||
1.一種社會事件網絡文本的輿情計算與推演方法,其特征在于,包括:
獲取社會事件網絡文本;
對所述社會事件網絡文本進行預處理,得到網絡社會事件文本字特征、網絡社會事件文本詞特征和網絡社會事件文本隱式特征;
將所述網絡社會事件文本字特征、所述網絡社會事件文本詞特征和所述網絡社會事件文本隱式特征分別輸入訓練好的社會情感計算模型和訓練好的文本情感計算模型預測,得到社會事件網絡文本的六種情感概率;
根據所述社會事件網絡文本的六種情感概率,采用投票機制方法確定社會事件網絡文本的情感取向;
所述訓練好的社會情感計算模型,具體訓練過程包括:
獲取待訓練的網絡社會事件文本初始特征;所述待訓練的網絡社會事件文本初始特征包括網絡社會事件文本初始字特征、網絡社會事件文本初始詞特征和網絡社會事件文本初始隱式特征;
將所述待訓練的網絡社會事件文本初始特征輸入CNN-LSTM模型的詞嵌入向量層,得到密文詞嵌入形式的網絡社會事件文本初始特征;具體公式如下:
其中,表示獨熱向量,所述獨熱向量表示所述待訓練的網絡社會事件文本中第j個樣本的第i個初始特征;表示詞向量,所述詞向量為所述密文詞嵌入形式的網絡社會事件文本初始特征;
根據滑動窗口和所述密文詞嵌入形式的網絡社會事件文本初始特征確定滑動窗口內的詞向量;
將所述滑動窗口內的詞向量輸入所述CNN-LSTM模型的CNN卷積層,確定文本特征向量;具體公式如下:
其中,表示經過卷積層處理之后得到的文本特征向量,[vi-2,vi-1,vi,vi+1,vi+2]表示第i個滑動窗口內的詞向量,[·]表示向量拼接;
將所述文本特征向量輸入所述CNN-LSTM模型的ReLU激活層,得到ReLU激活層的輸出結果;具體公式如下:
其中,表示ReLU激活層的輸出結果;
將所述ReLU激活層的輸出結果輸入所述CNN-LSTM模型的LSTM層,得到LSTM層的輸出結果;具體公式如下:
其中,表示第一層LSTM層的輸出結果,表示第二層LSTM層的輸出結果;
將所述LSTM層的輸出結果進行dropout操作,得到dropout操作的輸出結果;具體公式如下:
其中,表示dropout操作的輸出結果;
將所述dropout操作的輸出結果進行均值池化操作,確定有效數據;具體公式如下:
其中,為有效數據,為有效參數,所述有效參數的取值根據當前滑動窗口中數據是否有效確定,N表示網絡社會事件文本使用缺省值補齊之后的長度;
將所述有效數據輸入所述CNN-LSTM模型的全連接層,得到所述全連接層的輸出結果,將所述全連接層的輸出結果進行softmax分類,確定所述網絡社會事件文本的六種情感概率;具體公式如下:
其中,表示全連接層的輸出結果,WT表示全連接層中的權重參數的轉置,b表示全連接層中的偏執,表示第j個樣本在第l個情感維度上的取值,為網絡社會事件文本中第j個樣本被預測為第l個情感的概率;
根據所述網絡社會事件文本的六種情感概率采用公式確定損失函數;其中,L表示損失函數,表示網絡社會事件文本中第j個樣本在第l個情感維度上的真實取值;
以最小化所述損失函數為目標對所述CNN-LSTM模型中的參數進行優化,得到訓練好的社會情感計算模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海大學,未經上海大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010841830.2/1.html,轉載請聲明來源鉆瓜專利網。





