[發明專利]基于深度學習的主觀性文本情感分析方法有效
| 申請號: | 201710093687.1 | 申請日: | 2017-02-21 |
| 公開(公告)號: | CN106776581B | 公開(公告)日: | 2020-01-24 |
| 發明(設計)人: | 施寒瀟;厲小軍;陳南南 | 申請(專利權)人: | 浙江工商大學 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F40/30;G06F16/35 |
| 代理公司: | 33224 杭州天勤知識產權代理有限公司 | 代理人: | 胡紅娟 |
| 地址: | 310018 浙江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 深度 學習 主觀性 文本 情感 分析 方法 | ||
1.一種基于深度學習的主觀性文本情感分析方法,包括以下步驟:
(1)在C&W模型的基礎上,構建C&W-SP模型,將句子的情感標簽與詞性標簽標注于句子內,構建C&W-SP模型的訓練集,并利用該訓練集對C&W-SP模型進行訓練,得到訓練集中每個詞的詞向量,組成詞向量文件,具體包括:
(1-1)添加獲取句子的情感信息的情感抽取模塊和獲取句子中每個詞的詞性信息的詞性標注模塊于C&W模型上,得到C&W-SP模型;
(1-2)對數據集以句子為單位進行中文分詞操作,得到由m個句子組成的分詞數據集;
(1-3)將分詞數據集中的每個句子的情感標簽和每個句子中的每個詞語的詞性標簽標注于該句子內,作為C&W-SP模型訓練集;
(1-4)將C&W-SP模型訓練集輸入到C&W-SP模型中,以C&W-SP模型損失函數最小化為目標,采用隨機梯度下降和反向傳播算法更新模型參數,得到該訓練集中每個詞對應的詞向量,組成詞向量文件;
(2)根據獲得的詞向量文件,利用LSTM網絡構建句子向量集;
(3)利用句子向量集對神經網絡模型進行訓練,得到情感分類模型;
(4)對測試評論語句進行分詞處理、情感標簽與詞性標簽標注處理,并根據步驟(1)獲得的詞向量文件獲得該測試評論的詞向量輸入矩陣;然后通過步驟(2)的方法將測試詞向量轉化為測試句子向量,將測試句子向量輸入到情感分類模型中,計算得到此段評論的情感傾向。
2.根據權利要求1所述的基于深度學習的主觀性文本情感分析方法,其特征在于:所述的步驟(1-3)的具體步驟為:
(1-3-1)利用情感詞典方式或情感識別工具識別句子情感信息,并將該句子的情感標簽添加于句子的末端,以一個空格與整個句子隔開;
(1-3-2)利用詞性標注工具或分詞工具自帶的詞性標注模塊將句子中的每個詞的詞性標簽添加于每個詞的后端以下劃線隔開;
(1-3-3)利用詞性標注工具或分詞工具自帶的詞性標注模塊將句子的情感標簽的詞性標簽添加于該情感標簽的后端以下劃線隔開。
3.根據權利要求1所述的基于深度學習的主觀性文本情感分析方法,其特征在于:所述的C&W-SP模型分為輸入層、線性隱藏層、非線性隱藏層以及線性輸出層;訓練過程為:將訓練集作為輸入,通過滑動窗口的方式將窗口內每個詞的n-gram以及情感性信息和詞性信息輸入到模型進行訓練,通過線性隱藏層和非線性隱藏層,輸出一個二維標量[fcw,f1u],其中,fcw代表詞性-語義分數,f1u代表情感分數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江工商大學,未經浙江工商大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710093687.1/1.html,轉載請聲明來源鉆瓜專利網。





