[發明專利]文本情感分析方法、裝置、存儲介質和計算機設備有效
| 申請號: | 201710620545.6 | 申請日: | 2017-07-26 |
| 公開(公告)號: | CN107609009B | 公開(公告)日: | 2020-02-18 |
| 發明(設計)人: | 王寶巖;姜軍;王昕;張劍;張衛 | 申請(專利權)人: | 北京大學深圳研究院;深圳報業集團;深圳新聞網傳媒股份有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06N3/04 |
| 代理公司: | 廣州華進聯合專利商標代理有限公司 44224 | 代理人: | 謝曲曲 |
| 地址: | 518000 廣東省深圳市高新*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 情感 分析 方法 裝置 存儲 介質 計算機 設備 | ||
1.一種文本情感分析方法,所述方法包括:
對用于建模的文本進行預處理,對預處理后的文本中的句子進行人工情感標注,得到句子的情感分類結果;
將用于建模的文本根據預先訓練的詞向量集合得到句子的句向量,所述句向量是由所述句子中的詞的詞向量連接構成;
將所述句向量分別輸入到隨機初始化網絡參數的兩個卷積神經網絡和一個雙向長短期記憶神經網絡中進行訓練,得到所述句子的三個句子特征向量,將所述三個句子特征向量連接得到連接后的句子特征向量;
根據所述連接后的句子特征向量及標注后的句子的情感分類結果通過反向傳播算法訓練得到建模后的網絡參數以及更新后的所述句子中的詞的詞向量;
根據所述建模后的網絡參數得到預設的兩個卷積神經網絡和一個雙向長短期記憶神經網絡模型;
獲取測試文本中句子的句向量,所述句向量是由所述句子中的詞的詞向量連接構成;
將所述句向量分別輸入到預設的兩個卷積神經網絡和一個雙向長短期記憶神經網絡模型進行處理得到所述句子的三個句子特征向量;
將所述三個句子特征向量連接,通過分類器對連接后的句子特征向量進行分類得到所述句子的情感分類結果;
根據句子的情感分類結果得到測試文本的情感傾向。
2.根據權利要求1所述的方法,其特征在于,所述兩個卷積神經網絡包括:一個卷積核為3的卷積神經網絡和另一個卷積核為5的卷積神經網絡。
3.根據權利要求1所述的方法,其特征在于,所述將所述句向量分別輸入到預設的兩個卷積神經網絡和一個雙向長短期記憶神經網絡進行處理得到三個所述句子的句子特征向量,包括:
將所述句向量分別輸入到預設的兩個卷積神經網絡中進行卷積操作,再進行最大池化操作,生成第一句子特征向量;
將所述句向量輸入到預設的一個雙向長短期記憶神經網絡計算出第二句子特征向量,再將第二句子特征向量一維化。
4.根據權利要求1所述的方法,其特征在于,在所述對用于建模的文本進行預處理之前還包括訓練所述詞向量集合的過程,具體為:
獲取無標注語料庫;
對所述無標注語料庫中的句子進行預處理;
對預處理后的無標注語料庫中句子中的詞進行隨機初始化為詞向量;
獲取句子中目標詞及目標詞前后預設數目的詞的詞向量,計算最大化目標函數的值,根據所述最大化目標函數的值生成目標詞的詞向量;
獲取所述無標注語料庫中詞的詞向量。
5.根據權利要求1所述的方法,其特征在于,所述根據句子的情感分類結果得到測試文本的情感傾向,包括:
根據測試文本中句子的情感分類結果的比例,得到測試文本的情感傾向。
6.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,該程序被處理器執行時實現如權利要求1至5中任一項所述的文本情感分析方法。
7.一種計算機設備,所述計算機設備包括存儲器,處理器及存儲在所述存儲器上并可在所述處理器上運行的計算機程序,其特征在于,所述處理器執行所述計算機程序時實現如權利要求1至5中任一項所述的文本情感分析方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京大學深圳研究院;深圳報業集團;深圳新聞網傳媒股份有限公司,未經北京大學深圳研究院;深圳報業集團;深圳新聞網傳媒股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710620545.6/1.html,轉載請聲明來源鉆瓜專利網。





