[發明專利]一種考慮修飾詞的句子評論情感極性分析方法在審
| 申請號: | 202011293192.1 | 申請日: | 2020-11-18 |
| 公開(公告)號: | CN112364646A | 公開(公告)日: | 2021-02-12 |
| 發明(設計)人: | 徐勇;李曉宇;蘇發桂;呂錫志;李宇琪 | 申請(專利權)人: | 安徽財經大學 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F40/242;G06F40/211 |
| 代理公司: | 青島潤集專利代理事務所(普通合伙) 37327 | 代理人: | 張云花 |
| 地址: | 233000 *** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 考慮 修飾詞 句子 評論 情感 極性 分析 方法 | ||
1.一種考慮修飾詞的句子評論情感極性分析方法,其特征在于,包括以下步驟:
步驟1:評論文本預處理:對評論文本進行分詞,刪除停用詞、標點符號和空格符;
步驟2:對HowNet詞典進行改進;
步驟3:基于改進的HowNet詞典對預處理后的評論文本進行特征提取;
步驟4:識別情感短語:情感詞、修飾副詞和否定詞構成情感短語;
步驟5:情感短語的情感極性值計算:根據改進的HowNet詞典獲得情感詞的情感值,其中積極情感詞的情感極性值為1,消極情感詞的情感極性值為-1;
獲得修飾副詞和否定詞的權值,修飾副詞和否定詞的權值乘以情感詞的情感值得到的積為情感短語的情感極性值,當存在n個修飾副詞時對情感短語情感極性值的絕對值取1/n次冪進行歸范處理,且設定冪運算結果的符號與原值符號相同;
情感短語的情感極性值PS的計算公式為:
其中wn為否定詞的賦值,wa分別為修飾副詞的權重;m、n分別為否定詞、修飾副詞的個數;S為情感詞的情感極性值,S取值為1或-1;
步驟6:句子情感極性值計算:
句子情感極性值的計算公式為:
PSi為第i個情感短語的情感極性值,j為句子中情感短語的個數。
2.根據權利要求1所述的一種考慮修飾詞的句子評論情感極性分析方法,其特征在于,步驟1具體包括:預處理包括分詞、刪除標點符號、刪除停用詞、刪除換行符和刪除空格符,將預處理后的評論文本以列表的形式存儲,列表形式中每個元素是單個的詞語,以字符類型存儲。
3.根據權利要求1所述的一種考慮修飾詞的句子評論情感極性分析方法,其特征在于,步驟2具體包括:
在HowNet詞典中補充情感詞、修飾副詞和否定詞,補充后,HowNet詞典分為三大類,分別為:情感詞詞典、修飾副詞詞典和否定詞詞典;
情感詞詞典中包括積極情感詞和消極情感詞,積極情感詞的情感極性值為1,消極情感詞的情感極性值為-1;
修飾副詞詞典中根據詞語的不同包括6個權重值,分別為:2、1.75、1.5、1.25、0.5和0.25;
否定詞詞典中否定詞的賦值為-1。
4.根據權利要求1所述的一種考慮修飾詞的句子評論情感極性分析方法,其特征在于,步驟3特征提取具體包括:
a)確定積極情感詞的個數;
b)確定消極情感詞的個數;
c)確定否定詞的個數與位置;
d)確定修飾副詞的個數與位置。
5.根據權利要求1所述的一種考慮修飾詞的句子評論情感極性分析方法,其特征在于,句子情感極性值的取值范圍為[-5,5]。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于安徽財經大學,未經安徽財經大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011293192.1/1.html,轉載請聲明來源鉆瓜專利網。





