[發明專利]一種社交網絡中基于情感偏移感知的交互式微博文本情感挖掘方法有效
| 申請號: | 202110443368.5 | 申請日: | 2021-04-23 |
| 公開(公告)號: | CN113051916B | 公開(公告)日: | 2022-11-18 |
| 發明(設計)人: | 曹玖新;顧天韻;趙志翔 | 申請(專利權)人: | 東南大學 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F40/30;G06F16/9536;G06Q50/00;G06N3/04;G06N3/08 |
| 代理公司: | 南京眾聯專利代理有限公司 32206 | 代理人: | 杜靜靜 |
| 地址: | 211100 江蘇省南京市江寧*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 社交 網絡 基于 情感 偏移 感知 交互 式微 文本 挖掘 方法 | ||
1.一種社交網絡中基于情感偏移感知的交互式微博文本情感挖掘方法,其特征在于,所述方法包括如下步驟:
步驟1)根據社交網絡中單條微博文本以及其交互歷史的上下文語義信息,標注微博文本的情感極性,并劃分訓練集、驗證集與測試集;
步驟2)采用自然語言處理領域中的預訓練語言模型BERT,提取語句級的微博情感語義特征;
步驟3)針對交互式的社交網絡語境進行分析,基于長短期記憶網絡LSTM,提取語境級的微博情感語義特征;
步驟4)將步驟2)、步驟3)得到的特征拼接為特征向量,以表示微博的基本情感語義特征;
步驟5)針對情感偏移進行分析,要感知微博用戶在時間維度上相鄰文本之間所體現出的情感偏移,可抽象為句子對分類建模問題,因此將步驟4)所得的微博基本情感語義特征輸入多層感知機,映射至情感偏移標簽空間,進行參數學習,同時得到用戶情感偏移特征;
步驟6)針對情感影響關系進行分析,由于情感偏移能夠為各條微博之間的情感交互關系提供顯式且精確的線索,并且步驟5)中得到的情感偏移特征可以看作是情感偏移感知任務結果的估計值,此時情感偏移程度可以看作一個已知量,那么在已知各微博與上句相比是否會發生情感變化的基礎上再從語境中進一步提取信息,能夠更有針對性地挖掘出交互式語境中相關情感影響因素,由此可將步驟5)所得的情感偏移特征與步驟4)所得的基本情感語義特征進行融合,設計情感關聯關系增強的語境級Attention機制,進一步從交互歷史中提取出與當前微博相關的情感影響因素;
步驟7)根據步驟6)所得的情感影響因素,再與步驟4)所得的基本情感語義特征融合,得到在交互式語境下當前微博文本的最終情感特征,并輸入多層感知機,映射至微博情感極性標簽空間,進行參數學習;
步驟8)引入多任務學習范式,步驟5)可看作用戶情感偏移感知的輔助任務,步驟7)可看作微博文本情感識別的主任務,使兩者共享隱層參數共同學習,從而完成微博文本情感識別模型的構建,并通過采用最大似然估計和梯度下降法訓練學習得到模型參數;
步驟9)將待推斷文本情感的新樣本輸入步驟8)所得模型,最終輸出各情感極性類別下的概率值,概率值最大的類別就是推斷所得的微博文本情感。
2.根據權利要求1所述的一種社交網絡中基于情感偏移感知的交互式微博文本情感挖掘方法,其特征在于,所述步驟1)的數據集中對微博文本情感極性標注的具體方法為:綜合考慮社交網絡中單條微博文本以及其交互歷史的上下文語義信息,人工標注每條微博的情感極性。
3.跟據權利要求1所述的一種社交網絡中基于情感偏移感知的交互式微博文本情感挖掘方法,其特征在于,所述步驟2)中由于目前能夠獲取到的微博情感數據集的數據量有限,而自然語言處理領域流行的預訓練語言模型BERT已通過海量語料訓練出了提取句子通用語義表征的方式,利用BERT提取單條微博的通用語義表征,并且針對本情感分析任務,以Fine-tuning微調的方式使該部分在通用語義表征的基礎上更加關注情感語義信息,具體而言,對于某一交互式場景下包含的第i條微博,首先按照BERT的標準預處理方法對該條微博文本進行分詞并映射成Token Embeddings,輸入經過預訓練參數初始化的BERT模型,經過層層編碼,使用最終輸出的[CLS]對應位的隱含表示作為微博i的基本語義表征ti。
4.跟據權利要求1所述的一種社交網絡中基于情感偏移感知的交互式微博文本情感挖掘方法,其特征在于,所述步驟3)中考慮到社交網絡中的單條微博文本,其歷史語境是由一系列時序上連續、語義上連貫的語句所構成的語言整體,而循環神經網絡作為一種建模數據之間順序關系的標準方法被廣泛用于捕捉語言序列的上下文特征,因此基于循環神經網絡的某變體,長短期記憶網絡LSTM,提取語境級的微博情感語義特征。
5.根據權利要求1所述的一種社交網絡中基于情感偏移感知的交互式微博文本情感挖掘方法,其特征在于,所述步驟4)中將步驟2)、步驟3)得到的特征拼接為特征向量,以表示微博的基本語義特征
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東南大學,未經東南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110443368.5/1.html,轉載請聲明來源鉆瓜專利網。





