[發明專利]一種基于不均衡文本集的情感分類器構建方法、裝置、設備和介質有效
| 申請號: | 202010617303.3 | 申請日: | 2020-06-30 |
| 公開(公告)號: | CN111767399B | 公開(公告)日: | 2022-12-06 |
| 發明(設計)人: | 馮豆豆 | 申請(專利權)人: | 深圳平安智慧醫健科技有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/216;G06F40/242;G06F40/289;G06K9/62;G06N20/10 |
| 代理公司: | 北京英特普羅知識產權代理有限公司 11015 | 代理人: | 程超 |
| 地址: | 518000 廣東省深圳市前海深港合作區南山*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 均衡 文本 情感 分類 構建 方法 裝置 設備 介質 | ||
1.一種基于不均衡文本集的情感分類器構建方法,其特征在于,所述方法包括:
獲取第一不均衡樣本集,其中,所述第一不均衡樣本集包括多個第一樣本和每個所述第一樣本的情感概率樣本值;
從預置情感詞典中確定出所述第一樣本中的情感詞和所述情感詞的分值;
確定所述第一樣本中用于修飾所述情感詞的程度副詞的分值;
根據所述第一樣本中的所述情感詞的分值和所述程度副詞的分值計算所述第一樣本的情感分值;
根據預置情感分類器確定所述第一樣本的情感概率值,其中,所述預置情感分類器根據第二不均衡樣本集訓練得到,所述第二不均衡樣本集包括多個第二樣本和每個所述第二樣本的情感概率樣本值;
根據所述第一樣本的情感分值、所述預置情感分類器確定的所述第一樣本的情感概率值以及所述第一樣本的情感概率樣本值訓練第一機器學習算法,得到用于判斷文本情感類別的目標情感分類器。
2.根據權利要求1所述的方法,其特征在于,所述情感詞包括正面情感詞和負面情感詞,所述第一樣本的情感分值包括正面情感分值和負面情感分值,所述根據所述第一樣本中的所述情感詞的分值和所述程度副詞的分值計算所述第一樣本的情感分值,包括:
根據所述第一樣本中的所述正面情感詞的分值和用于修飾所述正面情感詞的程度副詞的分值計算所述第一樣本的正面情感分值;和/或
根據所述第一樣本中的所述負面情感詞的分值和用于修飾所述負面情感詞的程度副詞的分值計算所述第一樣本的負面情感分值。
3.根據權利要求2所述的方法,其特征在于,所述根據所述第一樣本中的所述正面情感詞的分值和用于修飾所述正面情感詞的程度副詞的分值計算所述第一樣本的正面情感分值,包括:
其中,scorepos表示第一樣本的正面情感分值,wordi表示第一樣本中的正面情感詞,wordpos表示預置情感詞典中的正面情感詞,表示wordi的程度副詞degreei的分值,表示wordi的分值。
4.根據權利要求2所述的方法,其特征在于,所述根據所述第一樣本中的所述負面情感詞的分值和用于修飾所述負面情感詞的程度副詞的分值計算所述第一樣本的負面情感分值,包括:
其中,scoreneg表示第一樣本的負面情感分值,wordj表示第一樣本中的負面情感詞,wordneg表示預置情感詞典中的負面情感詞,表示wordj的程度副詞degreej的分值,表示wordj的分值。
5.根據權利要求2所述的方法,其特征在于,所述情感概率樣本值包括正面情感概率樣本值、中立情感概率樣本值和負面情感概率樣本值,所述預置情感分類器確定的情感概率值包括正面情感概率值、中立情感概率值和負面情感概率值,所述根據所述第一樣本的情感分值、所述預置情感分類器確定的所述第一樣本的情感概率值以及所述第一樣本的情感概率樣本值訓練第一機器學習算法,得到用于判斷文本情感類別的目標情感分類器,包括:
將所述第一樣本的正面情感分值和負面情感分值以及所述預置情感分類器確定的所述第一樣本的正面情感概率值、中立情感概率值和負面情感概率值確定為所述第一機器學習算法的輸入參數;
將所述第一樣本的正面情感概率樣本值、中立情感概率樣本值和負面情感概率樣本值確定為所述第一機器學習算法的輸出參數;
根據所述第一機器學習算法的輸入參數和輸出參數訓練所述第一機器學習算法,得到用于判斷文本情感類別的目標情感分類器。
6.根據權利要求1所述的方法,其特征在于,所述根據預置情感分類器確定所述第一樣本的情感概率值,包括:
提取所述第一樣本的特征詞;
對所述第一樣本的特征詞進行降維處理得到第一目標特征詞;
將所述第一目標特征詞輸入所述預置情感分類器,得到所述第一樣本的情感概率值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳平安智慧醫健科技有限公司,未經深圳平安智慧醫健科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010617303.3/1.html,轉載請聲明來源鉆瓜專利網。





