[發明專利]一種基于約束關系的意見目標和情感詞聯合聚類方法有效
| 申請號: | 201310701519.8 | 申請日: | 2013-12-18 |
| 公開(公告)號: | CN103646097A | 公開(公告)日: | 2014-03-19 |
| 發明(設計)人: | 牛振東;黃勝;劉沙;陳杰 | 申請(專利權)人: | 北京理工大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100081 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 約束 關系 意見 目標 情感 聯合 方法 | ||
1.一種基于約束關系的意見目標和情感詞聯合聚類方法,其特征在于,?
首先對意見目標的約束關系進行定義:?
意見目標的正向約束關系:如果兩個意見目標之間存在共同的名詞或者名詞短語,則定義兩者之間存在意見目標的正向約束關系;?
意見目標的反向約束關系:在同一個評論文本單元中,如果意見目標之間存在句子級別上的共現關系,或者意見目標之間具有相反的評價意見傾向,則定義它們之間存在意見目標的反向約束關系;?
其次對情感詞的約束關系進行定義;?
已知和分別表示與情感詞oi與oj相關聯的的意見目標集合,定義與?之間的重合度Overlap為:?
其中,表示對集合取模操作;定義λ1為正向約束閾值參數,λ2為反向約束閾值參數,如果則定義情感詞oi和oj之間具有情感詞的正向約束關系;如果則定義oi和oj之間具有情感詞的反向約束關系;?
根據上述意見目標和情感詞的約束關系定義,對意見目標和情感詞進行基于約束關系的聯合聚類,具體步驟如下:?
步驟1、在用戶評論數據中對意見目標、情感詞以及情感詞對應的意見目標集合進行采集和預處理?
步驟2、在步驟1抽取的意見目標集合基礎上,抽取意見目標的正向和反向約束關系?
(1)意見目標的正向約束關系抽取:根據本發明定義的意見目標的正向約束關系,利用詞法分析技術抽取意見目標之間的正向約束關系;?
(2)意見目標的反向約束關系抽取:根據本發明定義的意見目標的反向約束關系,在用戶評論文本集合中,抽取意見目標之間的反向約束關系;?
(3)沖突消解:抽取的意見目標集合中可能存在著兩個結點之間同時存在正?向約束和反向約束的情況;當正向約束和反向約束發生沖突時,僅保留出現頻率較高的約束關系類型;?
步驟3、在步驟1抽取的情感詞集合以及與情感詞相關聯的意見目標集合的基礎上,抽取情感詞的約束關系?
根據本發明定義的情感詞的正向和反向約束關系,利用與情感詞相關聯的意見目標集合計算情感詞之間的重合度,以此來識別情感詞之間的正向和反向約束關系;?
步驟4、在步驟2和步驟3的基礎上,構建意見目標約束關系矩陣和情感詞約束關系矩陣?
(1)根據意見目標集合F中意見目標詞之間的正向約束關系構建意見目標的正向約束關系矩陣DF,如下所示:?
其中[DF]ij表示矩陣DF中的元素;fi和fj分別代表意見目標集合F中的兩個意見目標詞;i和j代表意見目標集合中第i個意見目標和第j個意見目標;?
(2)根據意見目標集合F中意見目標詞之間的反向約束關系構建意見目標的反向約束關系矩陣RF,如下所示:?
其中[RF]ij表示矩陣RF中的元素;fi和fj分別代表意見目標集合F中的兩個意見目標詞;i和j代表意見目標集合中第i個意見目標和第j個意見目標;?
(3)根據情感詞集合O中情感詞之間的正向約束關系構建情感詞的正向約束關系矩陣DO,如下所示:?
其中[Do]ij表示矩陣Do中的元素;oi和oj分別代表情感詞集合O中的兩?個情感詞;i和j代表情感詞集合中第i個情感詞和第j個情感詞;?
(4)根據情感詞集合O中情感詞之間的反向約束關系構建情感詞的反向約束關系矩陣RO,如下所示:?
其中[RO]ij表示矩陣RO中的元素;oi和oj分別代表情感詞集合O中的兩個情感詞;i和j代表情感詞集合中第i個情感詞和第j個情感詞;?
步驟5、構建意見目標和情感詞關聯矩陣?
步驟6、在步驟4和步驟5的基礎上,進行基于約束的聯合聚類求解?
步驟7、根據步驟6的求解結果,將意見目標集合和情感詞集合進行類別劃分和關聯配對?
對用戶評論文本的意見目標集合按照意見目標維度聚類后的結果劃分類別,對用戶評論文本的情感詞集合按照情感詞維度聚類后的結果劃分類別,同時選擇具有最大關聯概率的意見目標類和情感詞類進行配對,構建意見目標類和情感類的關聯關系,用于意見挖掘任務中后續的生成評論摘要和產品情感傾向性分析等。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京理工大學,未經北京理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310701519.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:玉米秸稈青貯法
- 下一篇:掃描機臺程式控制方法





