[發明專利]根據對社會事件的文字描述來預測社會情感的方法及系統有效
| 申請號: | 201210272225.3 | 申請日: | 2012-08-01 |
| 公開(公告)號: | CN102831184A | 公開(公告)日: | 2012-12-19 |
| 發明(設計)人: | 胡衛明;王麒深;吳偶;祝守宇 | 申請(專利權)人: | 中國科學院自動化研究所 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 中科專利商標代理有限責任公司 11021 | 代理人: | 宋焰琴 |
| 地址: | 100190 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 根據 社會 事件 文字描述 預測 情感 方法 系統 | ||
技術領域
本發明涉及計算機應用技術領域,特別涉及一種根據對社會事件的文字描述來預測社會情感的方法及系統。
背景技術
社會情感是指社會公眾對某一社會事件的整體情感傾向性。通過對社會情感的分析,可以明確公眾對某事件的情感、態度、立場、意圖等主觀上的反應,進而了解整個社會的主觀態度、情感與立場。
傳統的研究集中在從作者角度出發的情感分類上,且主要應用在商品評論和反饋中。其主要是沿用文本傾向性分析的思路和方法,即對主觀性文本進行分析和處理,從作者的角度得出其對某個事物(如產品)或事件的態度、觀點,并簡單概括為贊同(肯定)/反對(否定)或某個單一的情感類別。這種分析或者是基于詞語級的,或者基于句子篇章級的,所采用的方法或者是基于語義的情感詞相似度計算,或者是基于機器學習的情感的二值分類。前者需要構建并維持一個龐大的情感詞典,后者有要求所表達的主題單一、傾向性一致的局限性,而且一般都是將情感籠統的概括為褒、貶。這種情感的簡單籠統概括和待分析文本傾向性一致的限制都難以滿足現代社會大眾情感分析的需要,因為社會情感是指社會公眾的整體情感傾向性,而當面對一則社會事件時,不同的人往往會有不同的觀點、態度,會有不同的情感反應,很難以某一種情感類別來衡量,更好的研究方案是從大眾的角度出發來進行情感挖掘,挖掘結果不應是某個單一的情感類別,而是在多個情感標簽上的排序。
發明內容
(一)要解決的技術問題
本發明所要解決的技術問題是提供一種根據對社會事件的文字描述來預測社會情感的方法及系統,以預測社會公眾對某一則社會事件的情感傾向。
(二)技術方案
為達到上述目的,本發明提供了一種根據對社會事件的文字描述來預測社會情感的方法,該方法包括如下步驟:
S1、構建社會情感語料庫,所述社會情感語料庫是指與社會情感相關聯的文字語料庫,該文字語料庫的每個樣本包括一段與社會事件相關的文本和與之相對應的情感標簽序列,所述情感標簽是指社會公眾對所述社會事件的情感反應類別;
S2、對所述社會情感語料庫中的每一個樣本進行所述面向情感標簽排序的文本特征選擇及文本表示以得到數值型特征向量,建立訓練集,所述文本表示是指將非結構化的文本數據表示成計算機能識別與處理的結構化數據,也即將文本數據量化為數值型特征向量的過程;
S3、構建情感標簽序列的概率模型,所述概率模型將所述情感標簽序列映射到概率空間的概率值;
S4、構建情感簽序列損失函數,通過所述的概率模型,在情感標簽序列上構建損失函數,該情感標簽序列損失函數表征排序模型輸出的情感標簽序列與真實情感標簽序列的差異,通過優化該損失函數,得到社會情感預測模型;
S5、將描述社會事件的文本輸入所述社會情感預測模型,得到與該社會事件相對應的情感標簽排序,所述情感標簽排序表示對該社會事件所預測的社會情感。
為達到上述目的,本發明提供了一種社會情感預測系統,該系統包括:
數據預處理模塊,其用于構建社會情感語料庫,所述社會情感語料庫是指與社會情感相關聯的文字語料庫,該文字語料庫的每個樣本包括一段與社會事件相關的文本和與之相對應的情感標簽序列,所述情感標簽是指社會公眾對所述社會事件的情感反應類別;
特征提取模塊,該模塊與數據預處理模塊連接,用于接收預處理后的數據,對所述社會情感語料庫中的每一個樣本進行所述面向情感標簽排序的文本特征選擇及文本表示以得到數值型特征向量,建立訓練集,所述文本表示是指將非結構化的文本數據表示成計算機能識別與處理的結構化數據,也即將文本數據量化為數值型特征向量的過程;
模型訓練模塊,該模塊與特征提取模塊相連,主要功能是構建情感標簽序列的概率模型和情感標簽序列損失函數,學習出社會情感預測模型,所述概率模型將所述情感標簽序列映射到概率空間的概率,所述情感標簽序列損失函數表征排序模型輸出的情感標簽序列與真實情感標簽序列的差異。
預測模塊,該模塊用于將描述社會事件的文本輸入所述社會情感預測模型,得到與該社會事件相對應的情感標簽排序,所述情感標簽排序表示對該社會事件所預測的社會情感。
(三)有益效果
從上述技術方案可以看出,本發明具有以下優點:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院自動化研究所,未經中國科學院自動化研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210272225.3/2.html,轉載請聲明來源鉆瓜專利網。





