[發明專利]評論信息情感分析方法、裝置、計算機存儲介質和服務器有效
| 申請號: | 201810272482.4 | 申請日: | 2018-03-29 |
| 公開(公告)號: | CN108536784B | 公開(公告)日: | 2021-08-24 |
| 發明(設計)人: | 潘岸騰 | 申請(專利權)人: | 阿里巴巴(中國)有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/289;G06F40/30;G06K9/62 |
| 代理公司: | 北京智信禾專利代理有限公司 11637 | 代理人: | 吳肖肖 |
| 地址: | 310052 浙江省杭州市濱江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 評論 信息 情感 分析 方法 裝置 計算機 存儲 介質 服務器 | ||
1.一種評論信息情感分析方法,其特征在于,包括步驟:
獲取第一評論信息中每個分段的分詞集合;
確定每個分段的分詞集合中屬于預設的分詞特征庫的若干個分詞,其中,所述分詞特征庫用于描述其包含的各個分詞的價值大小順序,分詞的價值的大小基于分詞對情感褒貶的區分度的高低進行確定,分詞對情感褒貶的區分度越高,分詞的價值越大;
基于所述分詞特征庫,按照價值從大到小的順序對每個分段的若干個分詞進行排序,生成每個分段的預設維度的原始輸入特征;
對每個分段的原始輸入特征中每個元素進行哈希運算,并對哈希運算得到的哈希值進行取模,生成每個分段的向量;
基于每個分段的向量生成所述第一評論信息的向量;
將所述第一評論信息的向量輸入預先生成的情感分析模型中,得到所述第一評論信息的預測值,其中,所述情感分析模型用于表征向量與預測值之間的關聯關系;
將所述第一評論信息的預測值與預設閾值進行比較,根據比較結果得到所述第一評論信息的情感分析結果。
2.根據權利要求1所述的評論信息情感分析方法,其特征在于,所述情感分析模型通過以下步驟生成:
獲取訓練樣本包含的各個第二評論信息中每個分段的分詞集合,以及用戶對各個第二評論信息分類的類別;
確定每個分段的分詞集合中屬于所述分詞特征庫的若干個分詞,基于每個分段的若干個分詞生成每個分段的向量;
基于每個分段的向量生成各個第二評論信息的向量;
將各個第二評論信息的向量和各自的類別輸入循環神經網絡中進行訓練,生成情感分析模型。
3.根據權利要求2所述的評論信息情感分析方法,其特征在于,所述基于每個分段的向量生成各個第二評論信息的向量,包括:
按照各個第二評論信息中每個分段的先后順序,由各個分段的向量生成各個第二評論信息的向量。
4.根據權利要求2所述的評論信息情感分析方法,其特征在于,所述將各個第二評論信息的向量和各自的類別輸入循環神經網絡中進行訓練,生成情感分析模型,包括:
通過預設算法求解預先構建的損失函數最小時所述循環神經網絡的模型參數,基于求解的所述循環神經網絡的模型參數得到情感分析模型,其中,所述損失函數為與各個第二評論信息的預測值和類別有關的函數,各個第二評論信息的預測值為與所述循環神經網絡的模型參數和各個第二評論信息的向量有關的變量。
5.根據權利要求1至4任意一項所述的評論信息情感分析方法,其特征在于,所述分詞特征庫通過以下步驟得到:
根據用戶對輸入的各個第二評論信息分類的類別,從各個第二評論信息中篩選出訓練樣本,其中,所述訓練樣本包括正樣本和負樣本;
獲取所述訓練樣本的分詞集合,其中,所述訓練樣本的分詞集合包括正樣本的分詞集合和負樣本的分詞集合;
統計所述訓練樣本的分詞集合中每個分詞在所述正樣本的分詞集合中出現的第一次數和在所述負樣本的分詞集合中出現的第二次數;
根據所述訓練樣本的分詞集合中每個分詞的第一次數和第二次數,確定所述訓練樣本的分詞集合中每個分詞的價值;
按照價值從大到小的順序,從所述訓練樣本的分詞集合中選取預設數目的分詞,由所述預設數目的分詞構成分詞特征庫。
6.根據權利要求5所述的評論信息情感分析方法,其特征在于,所述根據所述訓練樣本的分詞集合中每個分詞的第一次數和第二次數,確定所述訓練樣本的分詞集合中每個分詞的價值,包括:
依次從所述訓練樣本的分詞集合中選取一個分詞;
若該分詞的總次數大于等于預設值,確定該分詞的價值為設定值與該分詞在正樣本占比和負樣本占比乘積的差,其中,該分詞在正樣本占比為該分詞的第一次數與總次數的比值,該分詞在負樣本占比為該分詞的第二次數與總次數的比值,總次數為第一次數和第二次數之和;
若該分詞的總次數小于預設值,確定該分詞的價值為零。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴(中國)有限公司,未經阿里巴巴(中國)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810272482.4/1.html,轉載請聲明來源鉆瓜專利網。
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





