[發明專利]面向微博“樹洞”留言文本的情感分析方法在審
| 申請號: | 202110336845.8 | 申請日: | 2021-03-29 |
| 公開(公告)號: | CN113111148A | 公開(公告)日: | 2021-07-13 |
| 發明(設計)人: | 林紹福;景曉敏;黃智生 | 申請(專利權)人: | 北京工業大學 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/35;G06F16/9536;G06F40/289;G06K9/62;G06N3/04;G06N3/08;G06Q50/00 |
| 代理公司: | 北京思海天達知識產權代理有限公司 11203 | 代理人: | 劉萍 |
| 地址: | 100124 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 面向 樹洞 留言 文本 情感 分析 方法 | ||
面向微博“樹洞”留言文本的情感分析方法屬于自然語言處理技術領域。抑郁癥患者于微博留言離世后,依然有微博留言信息不斷聚集,從而形成微博“樹洞”,一些人對生活失去希望,會選擇在主人離去的頁面傾吐情緒或自殺計劃。針對這部分人群如何對其進行分析及監測救援是目前需要解決的問題。本發明包含:(1)提出一種結合BiLSTM和CNN的深度學習模型分析微博文本情感極性。(2)在原模型的基礎上加入自注意力機制,通過注意力機制更好的表征文本詞向量的序列特征。該方法滿足了分析潛在抑郁人群情緒及監測的需求,對抑郁癥識別起到了至關重要的作用。
技術領域
本發明屬于自然語言處理技術領域,主要包括句法語義分析、信息提取和查詢、文本挖掘、神經網絡等重要分支。
背景技術
情感分析,也稱為意見挖掘,可以從書面語言中分析出人們的情感、觀點和態度。情感分析方法主要包括兩種:基于規則和基于機器學習。基于規則的方法依賴于情感詞典的構建,即將分詞后的文檔與情感詞典的詞進行匹配,并統計匹配成功的情感詞數量。傳統的機器學習算法具有良好的性能,前提是需要對文本做一定的處理,即傳統的機器學習算法對特征有一定的要求。因此,情感分析的表現很大程度上依賴于文本特征的選擇,這一過程需要大量的人力物力。深度學習通過構造深層次的網絡結構來學習數據特征和數據分布,從而可以在文本中自動去學習特征,這相對于傳統機器學習,會節約很多時間。
數據顯示,15%的抑郁癥患者死于自殺,50%以上的抑郁癥患者曾想過自殺。全球范圍內,抑郁癥已成為15-29歲群體的第二大死亡原因。部分抑郁癥患者自殺或其他原因離世后,依然有微博留言信息不斷聚集,從而形成微博“樹洞”,微博用戶在“樹洞”中訴說自己的心事以及自殺意圖,更有甚者,很多用戶集聚一起相約自殺。通過對留言內容的文本提取分析,對其進行情感分析及監測救援至關重要。因此,面向微博“樹洞”留言文本的情感分析方法是具有實際意義的。
發明內容
本發明的目的在于針對“樹洞”留言文本特性提出一個面向微博“樹洞”留言文本的情感分析方法,即以“樹洞”微博為實驗語料,綜合分析抑郁癥微博特性,結合場景需要,本方法在CNN模型的基礎上加入了對文本語義特征提取具有較好效果的加有詞注意力機制的BiLSTM模型,提出基于詞注意力機制的BiLSTM和CNN模型的集成模型即Att-BiLSTM-CNN,進行情感極性判斷。滿足對“樹洞”人群的情感分析及監測救援的需要。
附圖說明:
圖1是Att-BiLSTM-CNN總體框架圖
圖2是Att-BiLSTM-CNN模型圖
圖3是BiLSTM模型圖
圖4是BiLSTM網絡層結構圖
圖5是模型訓練參數設置圖
具體實施方式:
本發明采用基于注意力機制的BiLSTM-CNN模型進行情感分析,總體框架圖及模型圖如圖1、2所示,其技術方案一共分為四步:
(1)數據預處理:利用網絡爬蟲爬取新浪微博中“樹洞”留言內容,將數據存入excel中,并對數據進行去重、去無用數據清洗操作;利用python中jieba分詞對文本內容進行分詞處理,并去除停用詞,經word2vec方法將文本語料訓練成詞向量表示。
(2)將步驟(1)中詞向量作為BiLSTM模型的輸入,通過BiLSTM提取上下文全局特征。
作為傳統的序列模型,LSTM通常只在一個方向上讀取文本。在實際文本處理中,文本具有前后序列特征相關性,因此,本方法采用雙向長短期記憶模型即BiLSTM,包含兩個LSTM層,分別訓練前向和后向序列,既能保留LSTM解決長期依賴的優點,又可以兼顧到上下文信息,有效處理序列問題。BiLSTM模型及網絡層結構如圖3、4所示。
具體算法公式如下:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京工業大學,未經北京工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110336845.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種雙層防水底的帆布鞋
- 下一篇:制造半導體器件的方法





