[發明專利]一種面向稀疏數據的個性化情感分析方法與裝置有效
| 申請號: | 202010102417.4 | 申請日: | 2020-02-19 |
| 公開(公告)號: | CN111325027B | 公開(公告)日: | 2023-04-28 |
| 發明(設計)人: | 周德宇;張朦;張林海 | 申請(專利權)人: | 東南大學 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F40/30;G06N3/0442;G06N3/0455;G06N3/048;G06N3/047;G06N3/08 |
| 代理公司: | 南京蘇高專利商標事務所(普通合伙) 32204 | 代理人: | 孟紅梅 |
| 地址: | 211102 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 面向 稀疏 數據 個性化 情感 分析 方法 裝置 | ||
1.一種面向稀疏數據的個性化情感分析方法,其特征在于,包括如下步驟:
(1)對文檔進行預處理;
(2)使用基于深度神經網絡的基礎情感分析模型,以文檔的單詞作為輸入,通過句子級的語義表示學習和文檔級的語義表示學習分別計算得到文檔中每個句子的語義表示和文檔的語義表示,并將文檔的語義表示映射得到的數值作為情感打分基礎;
(3)使用基于群組的個性化情感分析模型,以基于深度神經網絡的基礎情感分析模型得到的文檔的語義表示、用戶向量和全局群組向量作為輸入,通過句子級的用戶表示學習和文檔級的用戶表示學習分別計算得到文檔中每個句子的用戶表示和文檔的用戶表示,并將文檔的用戶表示和基于深度神經網絡的基礎情感分析模型得到的語義表示表示級聯起來作為文檔最終表示,并將文檔的最終表示映射到兩個數值分別作為情感打分偏移和波動;情感打分偏移用于最終的打分計算,情感打分波動用于網絡的優化;使用聯合損失來對網絡進行優化,包括:對基于深度神經網絡的基礎情感分析模型使用均方誤差損失;對基于群組的個性化情感分析模型使用高斯懲罰損失,以實現從損失函數中學習得到情感波動,并減小波動過大的樣本對網絡的影響;加入基于群組向量的懲罰項使得學習得到的群組向量具有判別性;加入網絡參數的L2正則化項避免過擬合;
(4)將情感打分基礎和情感打分偏移相加得到最終的情感打分。
2.根據權利要求1所述的一種面向稀疏數據的個性化情感分析方法,其特征在于,所述步驟(1)中的文檔預處理包括:對文檔進行分詞,過濾掉文檔中的停用詞和所處理的數據集中僅出現一次的詞。
3.根據權利要求1所述的一種面向稀疏數據的個性化情感分析方法,其特征在于,所述步驟(2)中的使用基于深度神經網絡的基礎情感分析模型計算情感打分基礎包括:
(2.1)針對句子中的每個單詞,先映射為一個預先訓練好的詞向量,然后利用雙向長短記憶網絡Bi-LSTM對句子中的每個詞進行編碼得到每個詞的對應的隱狀態;使用注意力機制計算每個詞的權重;最后對每個詞加權求和,得到每個句子的語義表示;
(2.2)是針對文檔中的每個句子,以句子的語義表示作為輸入,利用Bi-LSTM對文檔中的每個句子進行編碼得到每個句子的對應的隱狀態;使用注意力機制計算每個句子的權重;最后對每個句子加權求和,得到文檔的語義表示;
(2.3)使用一個多層感知器對文檔級的語義表示映射到一個數值,即情感打分基礎。
4.根據權利要求1所述的一種面向稀疏數據的個性化情感分析方法,其特征在于,所述步驟(3)中的使用基于群組的個性化情感分析模型計算情感打分偏移和波動包括:
(3.1)以Bi-LSTM中的每個詞的隱狀態、群組全局向量和文檔對應的用戶向量為基礎,計算得到每個詞的用戶隱狀態;使用注意力機制計算每個詞對應的用戶隱狀態的權重;最后對每個詞對應的用戶隱狀態加權求和,得到句子的用戶表示;
(3.2)以Bi-LSTM中的每個句子的隱狀態、群組全局向量和句子用戶表示為基礎,計算得到每個句子的用戶隱狀態;使用注意力機制計算每個句子用戶的隱狀態的權重;最后對每個句子的用戶隱狀態加權求和,得到文檔的用戶表示;
(3.3)將文檔的語義表示和用戶表示級聯起來作為文檔最終表示;
(3.4)使用兩個多層感知機分別將文檔最終表示映射到兩個數值,即情感打分偏移計算和情感打分波動。
5.根據權利要求4所述的一種面向稀疏數據的個性化情感分析方法,其特征在于,句子的用戶表示為:
其中,
ek是第k個群組的全局向量,是詞wij對應的隱狀態,u是文檔對應的用戶向量,和是模型參數,softmax(·)是歸一化的邏輯回歸函數,tanh(·)是雙曲正切激活函數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東南大學,未經東南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010102417.4/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





