[發明專利]一種基于張量融合方式的情感分類的方法有效
| 申請號: | 201811441312.0 | 申請日: | 2018-11-29 |
| 公開(公告)號: | CN109614487B | 公開(公告)日: | 2021-07-13 |
| 發明(設計)人: | 李玉軍;王玥;冀先朋 | 申請(專利權)人: | 山東大學 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/289;G06F40/30 |
| 代理公司: | 濟南金迪知識產權代理有限公司 37219 | 代理人: | 楊樹云 |
| 地址: | 250199 山*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 張量 融合 方式 情感 分類 方法 | ||
本發明涉及一種基于張量融合方式的情感分類的方法,包括:(1)數據預處理;(2)訓練詞向量;(3)針對具體任務建模;利用雙向LSTM編碼每一句話的上下文信息和語義信息,經過每一層網絡的作用,得到每一句話的特征向量表示;(4)張量融合:采用張量融合的方式將模型輸出的三個特征向量進行融合,通過信息之間的融合,得到最佳全面的特征表示,然后將融合之后形成的特征向量送往分類器進行情感分類。(5)訓練模型。本發明不需要人工抽取任何特征,模型也不需要借助另外的自然語言處理工具對數據做預處理,同時不需要提前識別目前詞進行情感分類,算法簡單明了,效果明顯。
技術領域
本發明涉及一種基于張量融合方式的情感分類的方法,屬于自然語言處理技術領域。
背景技術
隨著當前時代的發展,網絡信息化的時代以一種前所未有的速度迅速影響著人們的生活。與此同時,社會媒體也呈現出多樣化的形態,論壇、博客以及微博等網絡媒介發展迅速,網絡用戶的參與性不斷提高,對于網絡的使用方式也產生了巨大的變化。用戶不再只是被動的獲取網絡知識,而是更加積極的成為網絡信息的制造者,這樣的改變使得網絡媒介中呈現出大量的用來表用戶情感、情緒和觀點的各類形式的主觀性信息,而文本則是其中最為重要的一種表現形式。針對這些主觀性信息,如何更加有效的利用這些海量的數據,提取出人們感興趣的、攜帶觀點的文本,并且對其作出準確的分析是迄今為止自然語言處理領域中的非常重要的研究課題之一。
文本情感分析,是自然語言處理研究領域中的一個非常重要的課題,亦可稱作意見挖掘,這是對人們的觀點,情緒評論,態度以及針對諸如產品、服務、組織、個體、事件、主題等實體的情感傾向作出有效的挖掘和分析,然后進一步對挖掘出來的信息歸納和推理的一類技術。文本情感分析自2002年由Bo Pang提出之后,獲得了很大程度的關注,特別是在產品評論等的情感分析上獲得了很大程度的關注。早期情感分析研究的方法主要是基于規則的方法和基于統計的方法。主要通過學習目標樣本的特征,根據特征的分布對文本作出類別的判斷。還有一些我們熟悉的機器學習方法,比如支持向量機,最大熵以及樸素貝葉斯等方法。這些方法建模和計算相對比較簡單,但是對于一些復雜的分類問題,這些方法的泛化能力卻受到很大的制約。
隨著深度學習的發展,以卷積神經網絡和循環神經網絡為代表的深度神經網絡模型在圖像處理、計算機視覺和語音識別領域取得了巨大的成功,在自然語言處理領域也取得了很大進展,尤其在文本情感分析方面吸引了廣大研究者的興趣。傳統的淺層學習中樣本特征的表示采用的是數數的形式,這些深度學習模型則是通過將底層特征進行組合,形成更加抽象的較高層的表示形式,在此基礎上獲得樣本數據的分布式表示。一些研究者采用卷積神經網絡模型來做文本情感分析,但是這種方法只能捕捉到局部上下文信息,存在信息丟失的問題。為了彌補這個問題,一些研究者采用長短時記憶神經網絡來做文本情感分析,有效利用了文本的上下文信息和長時間的前后時序信息。但是有些復雜的文本中可能會存在多種情感傾向,如何得到一個正確的情感分類結果便成為了文本情感分類的難點。因此,如何利用深度學習模型獲取一段文本的最有效、最綜合、最全面的分布式表示,是影響文本情感分析效果的一個重要因素。
發明內容
針對現有技術的不足,本發明提供了一種基于張量融合方式的情感分類的方法;
本發明主要是針對存在多情感傾向問題的情感分類,由于數據集中每一段文本都包含有三句話,利用雙向LSTM對每一句話提取特征,獲取每一句的情感特征向量,采用張量融合的方式,將每一個特征向量進行有效的融合,形成一個總的聯合特征表示送往分類器進行分類。
該模型完全適用于存在多情感傾向的情感分類問題,克服了傳統做法中需要提前識別目標詞的缺點,也不需要借助其他的自然語言處理工具,算法簡單,效果顯著。同時,該模型采用了張量融合的方式,充分利用了數據本身的信息,利用模型去除冗余信息,保留并利用有用信息,做到了信息利用率的最大化。
術語解釋:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山東大學,未經山東大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811441312.0/2.html,轉載請聲明來源鉆瓜專利網。





