[發明專利]基于表情分析和深度學習的社交網絡情感分析方法在審
| 申請號: | 201611035151.6 | 申請日: | 2016-11-17 |
| 公開(公告)號: | CN106598942A | 公開(公告)日: | 2017-04-26 |
| 發明(設計)人: | 金志剛;胡博宏;羅詠梅 | 申請(專利權)人: | 天津大學 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06F17/30;G06Q50/00 |
| 代理公司: | 天津市北洋有限責任專利代理事務所12201 | 代理人: | 程毓英 |
| 地址: | 300072*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 表情 分析 深度 學習 社交 網絡 情感 方法 | ||
技術領域
本發明是一種基于表情分析和深度學習的社交網絡情感分析方法。
背景技術
隨著互聯網的飛速發展,越來越多的用戶喜歡在網絡上發布自己的觀點、分享個人的生活狀態,同時加強與朋友的溝通交流,社交媒體也因此發展迅猛。微博,作為一個基于用戶關系信息分享、傳播以及獲取的平臺,改變了傳統網絡媒體交流方式,開創了一個新的社交媒體互動模式,給用戶提供更為豐富的信息內容和便捷的溝通方式,迅速成為了最受歡迎的社交網絡媒體。
在微博平臺中,用戶通過發表個人對社會熱點事件的看法、某一產品的購物體驗等等,來表達自己的情感,形成了海量的話題文本信息。充分處理分析這些文本信息具有重要的社會價值、商業價值以及用戶價值。因此,如何提高微博情感分析的精度,使微博情感分析發揮更大的價值是一個充滿意義的工作。
發明內容
本發明針對微博情感分析問題,設計了一種將表情分析與深度學習模型結合的具體情感分析方法,進而改善情感分析效果。技術效果如下:
一種基于表情分析和深度學習的社交網絡情感分析方法,包括下列步驟:
1)文本預處理:過濾無用字符,并提取出微博文本中的表情字符作為該微博對應的表情信息。
2)數值化特征:將1)中預處理后的微博文本轉換為數值向量T,同時,1)中所得的表情信息也轉換成該表情對應的數值ID,然后將文本向量T與表情ID合并,形成新的數值向量V。
3)特征訓練:將數值向量V作為深度學習模型的輸入,進行特征訓練,設輸出的特征向量為F。
4)計算類別:對特征向量F進行Softmax回歸,計算出該微博的情感類別概率分布,進而獲得情感類別。
5)模型微調:將4)所得的情感類別與該微博實際所屬的情感類別比較,并通過反向傳播算法對模型進行微調,獲得訓練完成的模型。
基于表情分析和深度學習的社交網絡情感分析方法,將深度學習應用至文本情感分析問題中,提高模型的精度進而獲得更準確的情感分析效果。此外,本方法還考慮到微博平臺為用戶提高了豐富的默認表情,同時表情字符在微博中的使用也越來越頻繁,逐漸成為用戶表達情感的重要手段。因此,本方法并不像傳統方法在分析文本時將表情字符作為無用信息過濾,而是提取表情字符,使其作為模型訓練時的輸入,進而獲得更好的情感分析效果。有益效果如下:
1.利用深度學習模型的抽象特征提取能力學習文本的抽象特征,進而提高情感分析的精度;
2.通過在文本預處理階段提取(而不是過濾)表情字符,并將表情字符作為后續深度學習模型的輸入,為情感分析提供多維度的信息,進而提高情感分析精度。
附圖說明
圖1本方法的基本訓練步驟
圖2本方法的基本使用步驟
具體實施方式
下面結合附圖對實施方式進行說明。
本方法提出的情感分析方法重點在于其模型的訓練過程,該過程如圖1所示,以下詳細說明:
1)文本預處理:過濾無用字符,例如“轉發微博”等;同時,提取出微博文本中的表情字符作為該微博對應的表情信息,由于該表情字符由微博平臺提供,因此可根據其規律提取。
2)數值化特征:將1)中預處理后的微博文本通過word2vec工具轉換為數值向量T,同時,1)中所得的表情信息也轉換成該表情對應的數值ID,然后將文本向量T與表情ID合并,形成新的數值向量V。
3)特征訓練:將數值向量V作為深度學習模型的輸入,進行特征訓練,設輸出的特征向量為F。
4)計算類別:對特征向量F進行Softmax回歸,計算出該微博的情感類別概率分布,進而獲得情感類別。
5)模型微調:將4)所得的情感類別與該微博實際所屬的情感類別比較,并通過反向傳播算法對模型進行微調,最終獲得訓練完成的模型。
模型經過大量的訓練數據訓練完成后,再次輸入微博文本即可獲得該文本對應的情感類別結果,具體步驟如圖2所示,其中“計算特征”與“計算情感類別結果”與訓練過程中的“特征訓練”與“計算類別”對應。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津大學,未經天津大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611035151.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種全局優化文本關鍵詞質量的算法
- 下一篇:智能藏文自動分詞系統





