[發明專利]融合用戶情感傾向的社交網絡評論文本情感分析方法及系統在審
| 申請號: | 202210054262.0 | 申請日: | 2022-01-18 |
| 公開(公告)號: | CN114443844A | 公開(公告)日: | 2022-05-06 |
| 發明(設計)人: | 陳潔;宋楠;趙姝;張燕平 | 申請(專利權)人: | 安徽大學 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/216;G06Q50/00 |
| 代理公司: | 合肥市浩智運專利代理事務所(普通合伙) 34124 | 代理人: | 張景云 |
| 地址: | 230039 *** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 融合 用戶 情感 傾向 社交 網絡 評論 文本 分析 方法 系統 | ||
1.融合用戶情感傾向的社交網絡評論文本情感分析方法,其特征在于,包括以下步驟:
步驟1、首先根據聯合國人口基金會定義青少年的年齡范圍為14-25歲的原則,將社交網絡用戶數據集根據用戶個人資料的年齡信息劃分14-25歲為青少年用戶,再將他們各自對應的評論文本數據集分為訓練樣本和測試樣本,然后統計各個用戶評論的星級分類作為情感分類信息,再統計用戶之間的社交關系信息,計算出各個用戶的情感傾向分值;具體過程為:統計社交網絡用戶的評論,根據其星級將評論分為消極評論和積極評論,假設每個用戶有p個積極評論和n個消極評論,再統計數據集中用戶的社交關系,統計其數量為f,其情感傾向分值計算公式為:
其中,N是用戶的數量,是第i個用戶的社交關系數量,是第i個用戶積極評論的數量,是第i個用戶的消極評論數量,si代表第i個用戶的情感傾向分值;
步驟2、以用戶的情感傾向分值作為用戶的屬性信息,用戶與用戶之間的社交網絡關系信息作為邊信息,構建一個用戶-用戶社交網絡的圖網絡結構;
步驟3、利用圖注意力網絡模型GAT提取用戶所述圖網絡結構中的用戶情感傾向特征;
步驟4、利用Transformers模型對評論文本進行編碼得到評論文本特征;
步驟5、將用戶情感傾向特征和評論文本特征通過聯合策略得到每個評論的聯合特征,再構建邏輯回歸模型,用訓練樣本的評論聯合特征進行模型的參數訓練,再對測試樣本進行情感極性預測分析。
2.根據權利要求1所述的融合用戶情感傾向的社交網絡評論文本情感分析方法,其特征在于,所述步驟2的具體過程為:用計算的出的所有用戶的情感傾向分值si組成集合s={s1,s2,…,sN},集合s作為用戶的屬性信息。統計用戶i和用戶j社交關系,有社交關系的組成組合[i,j],最終用戶之間構建一個E×2的矩陣A,E是邊的總數量,矩陣A代表用戶與用戶的社交關系矩陣,
3.根據權利要求2所述的融合用戶情感傾向的社交網絡評論文本情感分析方法,其特征在于,所述步驟3的具體過程為:定義每個用戶的初始節點向量為h,維度為h=[f,p,n],所有用戶組成集合h={h1,h2,…,hN},根據矩陣A的關系組成矩陣[hi,hj],用戶j是用戶i的鄰居,使用注意力機制計算用戶j對用戶i的重要性,即注意力值,具體做法如下:
其中,αij是用戶i和用戶j之間的注意力值,是前饋神經網絡的權值參數,F是用戶輸出的向量維度,是先行轉化h的權值參數,||表示拼接操作,激活函數采用LeaKyReLU;
模型采用多頭注意力機制,有K個注意力頭,每個注意力頭對節點i的向量進行更新,最終把節點i的所有向量拼接起來取平均值,最終得到用戶情感傾向特征h′i,其計算公式如下:
采用tanh激活函數,得到的h′i即為第i個用戶的情感傾向特征,維度為
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于安徽大學,未經安徽大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210054262.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種燃料電池電堆的快速活化方法
- 下一篇:一種激光沖擊-超聲滾壓復合強化方法





