[發明專利]文本情感傾向判斷方法與系統在審
| 申請號: | 201410219390.1 | 申請日: | 2014-05-22 |
| 公開(公告)號: | CN105095183A | 公開(公告)日: | 2015-11-25 |
| 發明(設計)人: | 張磊;尚磊 | 申請(專利權)人: | 株式會社日立制作所 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27 |
| 代理公司: | 中科專利商標代理有限責任公司 11021 | 代理人: | 李國華 |
| 地址: | 日本*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 情感 傾向 判斷 方法 系統 | ||
技術領域
本發明涉及數據處理技術領域中的用戶文本情感傾向判斷。更具體而言,本發明涉及一種基于用戶性格特征的文本情感傾向判斷方法與系統。
背景技術
隨著SNS(SocialNetworkingServices,社會性網絡服務)不斷流行,人們通過微博、論壇等平臺,對人物、事件、產品發布各種各樣的觀點。為了有效處理這些信息,發現人們的態度意見,就需要進行文本情感分析。文本情感傾向,表達了人們對某事件、某產品的喜好。
然而,在個性化時代的今天,每個人表達情感的方式和程度都是不一樣的。比如對于“還好”這個詞,對一些人表示“好的”而對另一些人則表示“一般”而已。因此如何能根據每個人不同的性格特征、表達特點去做情感判斷才客觀真實。
為了解決上面提到的問題。我們首先來看看現有技術方法,以及該方法的不足。
在專利文獻1中公開了一種情感分析系統及方法,該系統包括語料庫建立模組,用于建立觀點句識別及情感傾向分析所需的訓練集;數據預處理模組,用于對訓練集中的句子進行預處理;觀點句識別模組,采用支持向量機分類器與貝葉斯分類器分別對預處理后的句子進行觀點句識別,并對兩分類器的結果進行集成處理,得到最終的分類結果;以及情感傾向分析模組,基于支持向量機分類器及貝葉斯分類器分別直接將預處理后的句子分為正面、負面和無觀點三類,并通過一集成公式將該支持向量機分類器和貝葉斯分類器的分類結果集成,得到當前句子的分類結果
在專利文獻2中公開了一種面向微博短文本的情感分析方法,該方法包括:步驟1,采集包含指定關鍵字詞的微博數據存入數據庫;步驟2,對微博數據進行預處理;步驟3,加載相關字典;步驟4,進行分句,過濾掉不包含用戶配置關鍵字的句子;步驟5,對包含關鍵字的句子進行分詞,詞性標注;步驟6,利用句法分析工具對包含主題的句子進行依存句法分析;步驟7,對包含主題詞的每個句子的極性進行判斷;步驟8,判斷完所有包含主題詞的句子的極性后,判斷整條微博的情感傾向性。
然而,在現有技術中都存在一個共同問題:忽略了人本身的性格特征和表達方式,情感分析按照統一的無差別的方式進行標準化計算,得出的情感傾向必然失真。
現有技術文獻
專利文獻
專利文獻1:CN103034626A
專利文獻2:CN102663046A
發明內容
本發明鑒于上述問題而研發,目的在于提供一種考慮了用戶性格特征的文本情感傾向判斷方法與系統,提高文本情感傾向判斷的準確性。
本發明的一個方面涉及一種文本情感傾向判斷方法,其特征在于包括:語料取得步驟,取得一定時間窗口內的用戶歷史文本信息作為語料;用戶性格特征判斷步驟,根據所述語料判斷用戶的性格特征;情感詞匯權重調整步驟,利用情感詞匯詞典獲取需要判斷的用戶文本中的情感詞匯以及初始權重形成情感詞匯列表,并且根據所述用戶性格特征判斷步驟中判斷出的用戶的性格特征對所述情感詞匯列表中的詞匯權重進行調整;以及文本情感傾向判斷步驟,根據所述情感詞匯列表中每個詞匯的極性及其被調整過的權重,判斷所述需要判斷的用戶文本的情感傾向。
另外,在本發明中優選:還包括文本處理步驟,在所述文本處理步驟中,對所述語料或者所述需要判斷的用戶文本進行分詞、詞性判斷,并且利用情感詞匯詞典獲取所述語料或者所述需要判斷的用戶文本中的情感詞匯,在所述用戶性格特征判斷步驟中,根據所述語料中的情感詞匯來判斷用戶的性格特征。
另外,在本發明中優選:所述用戶性格特征判斷步驟包括:將所述語料按照文本發布的時間進行排序的步驟;按照時間對所述語料進行聚類,并將不同的聚類分別保存在不同的語料集合中的步驟;對每一個所述語料集合中的語料進行分析,判斷對于當前語料集合的用戶性格特征的步驟;以及對全部所述語料集合的用戶性格特征進行綜合計算,從而得到最終的用戶的性格特征的步驟。
另外,在本發明中優選:在對全部所述語料集合的用戶性格特征進行綜合計算時,利用下述數學式調整用戶性格特征的權重W,
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于株式會社日立制作所,未經株式會社日立制作所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410219390.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種處理數據的方法及裝置
- 下一篇:一種自適應嵌入式處理器





