[發明專利]一種基于加窗詞向量特征的短文本情感分析方法有效
| 申請號: | 201811156163.3 | 申請日: | 2018-09-30 |
| 公開(公告)號: | CN109388800B | 公開(公告)日: | 2023-04-18 |
| 發明(設計)人: | 申亞博;馬勇;顧明亮;趙冬梅;申影利;李世黨;魏明生 | 申請(專利權)人: | 江蘇師范大學 |
| 主分類號: | G06F40/284 | 分類號: | G06F40/284;G06F16/35 |
| 代理公司: | 南京經緯專利商標代理有限公司 32200 | 代理人: | 周敏 |
| 地址: | 221000 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 加窗詞 向量 特征 文本 情感 分析 方法 | ||
1.一種基于加窗詞向量特征的短文本情感分析方法,其特征在于,包括步驟:
S1、詞向量訓練:對大規模語料進行預處理,再對預處理后的大語料進行詞向量訓練,得到一定維度的詞向量;
S2、特征提?。簩Υ治鑫谋具M行預處理,選擇文本情感分類中的若干特征,對特征進行篩選,選出最具有區分能力的特征;
S3、詞向量轉換:將步驟S2得到的數據轉換為由步驟S1中的詞向量所組成的文本向量;
S4、加窗操作:對文本向量中的詞向量進行加窗操作,形成新的組合維度;
S5、獨立分類器建模:對步驟S4中加窗后的詞向量進行建模訓練,得出各自的識別率;
具體針對不同窗長的組合特征使用不同的分類器,對組合特征進行建模訓練,進而針對加窗后得到的不同組合維度的特征,進行建模分類;
S6、分類器加權融合:使用網格搜索方法尋找最優的權重組合,將權重與對應的分類器判定概率相乘求和,得到最終分析結果。
2.根據權利要求1所述的一種基于加窗詞向量特征的短文本情感分析方法,其特征在于,所述步驟S1具體包括:
詞向量訓練:對大規模語料進行預處理,采用Word2Vec工具對預處理后的大語料進行詞向量訓練得到一定維度的詞向量。
3.根據權利要求1所述的一種基于加窗詞向量特征的短文本情感分析方法,其特征在于,所述步驟S2具體包括:
特征提取:對待分析文本進行預處理,先選擇文本情感分類中的一元詞特征、句法特征和基于詞典的特征,再對特征進行篩選,選出最具有區分能力的特征。
4.根據權利要求1或3所述的一種基于加窗詞向量特征的短文本情感分析方法,其特征在于,所述步驟S2中的對特征進行篩選所采用的方法為IG、MI方法。
5.根據權利要求1所述的一種基于加窗詞向量特征的短文本情感分析方法,其特征在于,所述步驟S4具體包括:
加窗操作:對文本向量中的詞向量進行加窗操作,形成新的組合維度,其中窗長從2到7。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于江蘇師范大學,未經江蘇師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811156163.3/1.html,轉載請聲明來源鉆瓜專利網。





