[發明專利]一種中文情感表達組合抽取方法及裝置有效
| 申請號: | 201710182656.3 | 申請日: | 2017-03-24 |
| 公開(公告)號: | CN106951412B | 公開(公告)日: | 2020-07-24 |
| 發明(設計)人: | 陳文亮;盧奇 | 申請(專利權)人: | 蘇州大學 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F40/30 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 羅滿 |
| 地址: | 215123 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 中文 情感 表達 組合 抽取 方法 裝置 | ||
本發明公開了一種中文情感表達組合抽取方法,包括:提取目標中文語句庫中每個語句包含的對象、觀點詞和關系詞;構建該語句對應的一個或多個組合項,每個組合項包含一個情感表達組合及該情感表達組合與一個關系詞的映射關系,每個情感表達組合為一個對象和一個觀點詞構成的二元對;對所有語句對應的組合項進行匯總,確定組合項候選集;根據情感表達組合與關系詞的映射關系,對組合項候選集中的情感表達組合進行排序;根據排序結果,確定待抽取的情感表達組合。應用本發明實施例所提供的技術方案,抽取到具體的情感表達組合,可以作為情感分析的情感資源,提高情感分析的可靠性。本發明還公開了一種中文情感表達組合抽取裝置,具有相應技術效果。
技術領域
本發明涉及自然語言處理技術領域,特別是涉及一種中文情感表達組合抽取方法及裝置。
背景技術
隨著互聯網技術的快速發展、信息化逐漸增強,信息量越來越大,形成了極具有研究價值的龐大數據。根據互聯網大數據來分析用戶的情感,讓計算機理解人類情感,是自然語言處理(NLP)的一個重要研究方向。
情感分析在NLP中具有重要的研究意義。目前用于情感分析的情感資源還不充分,主要資源大多是情感詞典,利用情感詞典進行觀點的傾向性分析。
通過這種方式僅能得到籠統的觀點傾向,在情感分析任務中,情感的傾向性只是其中一個方面,僅僅知道大多數用戶的觀點傾向遠遠不夠。比如,在一個購物網站上,如果僅給出某款型號電腦的好評率,則只能給用戶一個大致的判斷,用戶據此很難確定是否要購買。所以,通過這種方式給出的情感表達過于寬泛,情感分析可靠性不高。
發明內容
本發明的目的是提供一種中文情感表達組合抽取方法及裝置,以抽取出具體的情感表達組合,提高情感分析的可靠性。
為解決上述技術問題,本發明提供如下技術方案:
一種中文情感表達組合抽取方法,包括:
提取目標中文語句庫中每個語句包含的對象、觀點詞和關系詞;
針對每個語句,基于提取到的該語句包含的對象、觀點詞和關系詞,構建該語句對應的一個或多個組合項,每個組合項包含一個情感表達組合及該情感表達組合與一個關系詞的映射關系,每個情感表達組合為一個對象和一個觀點詞構成的二元對;
對所有語句對應的組合項進行匯總,確定組合項候選集;
根據情感表達組合與關系詞的映射關系,對所述組合項候選集中的情感表達組合進行排序;
根據排序結果,確定待抽取的情感表達組合。
在本發明的一種具體實施方式中,所述提取目標中文語句庫中每個語句包含的對象、觀點詞和關系詞,包括:
在目標中文語句庫中,根據預設的第一類詞性,提取每個語句包含的對象;
根據預設的第二類詞性,提取每個語句包含的觀點詞;
針對每個語句,分別將該語句中每個對象和每個觀點詞的中間部分確定為關系詞。
在本發明的一種具體實施方式中,所述映射關系中攜帶相應情感表達組合與關系詞的映射方向的信息。
在本發明的一種具體實施方式中,所述對所有語句對應的組合項進行匯總,確定組合項侯選集,包括:
確定所有語句對應的組合項中相同組合項的出現次數;
對所有語句對應的組合項進行去重處理;
根據去重結果,確定組合項侯選集,所述組合項侯選集中包含多個組合項及每個組合項的出現次數信息。
在本發明的一種具體實施方式中,所述根據去重結果,確定組合項侯選集,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州大學,未經蘇州大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710182656.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種溫度可調節的磁力攪拌器
- 下一篇:一種乳化生產線





