[發明專利]輿情情感識別方法、裝置及計算機可讀存儲介質有效
| 申請號: | 201811096799.3 | 申請日: | 2018-09-18 |
| 公開(公告)號: | CN109359296B | 公開(公告)日: | 2023-08-18 |
| 發明(設計)人: | 鄭少杰;蔡遠航;付勇;林文聰;范增虎 | 申請(專利權)人: | 深圳前海微眾銀行股份有限公司 |
| 主分類號: | G06F40/279 | 分類號: | G06F40/279;G06F40/242;G06F40/289;G06F16/35;G06F16/953;G06F18/22 |
| 代理公司: | 北京同立鈞成知識產權代理有限公司 11205 | 代理人: | 楊澤;劉芳 |
| 地址: | 518052 廣東省深圳市前海深港合作區前*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 輿情 情感 識別 方法 裝置 計算機 可讀 存儲 介質 | ||
1.一種輿情情感識別方法,其特征在于,所述輿情情感識別方法包括:
采用主題模型算法對同一領域的多個輿情文檔進行主題聚類,得到多個主題簇,每一主題簇包括一個或多個文檔;
對相應主題簇進行正負情感標注,得到帶有正負情感標簽的文檔;
將帶有正負情感標簽的文檔作為訓練樣本,進行情感識別模型訓練;
基于所述情感識別模型,對待識別的目標輿情文檔進行情感識別;
所述基于所述情感識別模型,對待識別的目標輿情文檔進行情感識別包括:
對所述目標輿情文檔進行分句,得到構成所述目標輿情文檔的所有句子;
計算所述目標輿情文檔的標題與每一個句子的相似度;
基于所述相似度,對每一個句子進行排序;
通過最大邊界相關算法,從排序后的所有或指定數量的句子中選出指定數量的句子;
將選出的句子作為所述目標輿情文檔中的關鍵句,以形成文本摘要;
基于所述情感識別模型,對所述文本摘要進行情感識別;
所述對相應主題簇進行正負情感標注包括:
獲取用戶指定的主題簇以及主題簇對應的正負情感;
對用戶指定的主題簇進行正負情感標注。
2.如權利要求1所述的輿情情感識別方法,其特征在于,所述對相應主題簇進行正負情感標注包括:
基于預置的情感詞典,從所有主題簇中篩選出具有情感傾向的主題簇并進行正負情感標注。
3.如權利要求1或2所述的輿情情感識別方法,其特征在于,在所述對相應主題簇進行正負情感標注,得到帶有正負情感標簽的文檔的步驟之后還包括:
判斷本輪主題聚類進行正負情感標注的主題簇數量以及正負向情感之間主題簇數量比例是否滿足形成訓練樣本的條件;
若是,則停止進行下一輪主題聚類;
若否,則增大進行主題聚類所輸出的主題簇數量并繼續采用主題模型算法對所述輿情文檔進行下一輪主題聚類。
4.如權利要求1所述的輿情情感識別方法,其特征在于,所述基于所述情感識別模型,對所述文本摘要進行情感識別包括:
對所述文本摘要進行切詞,得到多個單詞;
基于切詞得到的單詞,構建所述文本摘要中各單詞對應的詞向量;
將所述詞向量合并為句向量,并將所述句向量輸入所述情感識別模型,以對所述文本摘要進行情感識別。
5.一種輿情情感識別裝置,其特征在于,所述輿情情感識別裝置包括存儲器、處理器以及存儲在所述存儲器上并可在所述處理器上運行的輿情情感識別程序,所述輿情情感識別程序被所述處理器執行時實現如權利要求1-4中任一項所述的輿情情感識別方法的步驟。
6.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質上存儲有輿情情感識別程序,所述輿情情感識別程序被處理器執行時實現如權利要求1-4中任一項所述的輿情情感識別方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳前海微眾銀行股份有限公司,未經深圳前海微眾銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811096799.3/1.html,轉載請聲明來源鉆瓜專利網。





