[發明專利]基于本體模型和多核支持向量機的情感原因抽取方法在審
| 申請號: | 201811303734.1 | 申請日: | 2018-11-02 |
| 公開(公告)號: | CN109670045A | 公開(公告)日: | 2019-04-23 |
| 發明(設計)人: | 謝英杰;孫越恒;王文俊 | 申請(專利權)人: | 天津大學 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F16/951;G06F17/27;G06K9/62 |
| 代理公司: | 天津市北洋有限責任專利代理事務所 12201 | 代理人: | 程小艷 |
| 地址: | 300072*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 多核支持向量機 支持向量機算法 抽取 語料庫 構建 基礎本體 模型構建 事件聚類 事件識別 文本信息 行為概念 因果關系 預測 算法 標注 融合 地域 拓展 應用 發現 | ||
本發明公開一種基于本體模型和多核支持向量機的情感原因抽取方法,該方法主要步驟為:首先構建情感原因語料庫;然后根據ABC本體模型構建情感原因本體模型;在此模型上基于支持向量機算法對情感原因事件進行識別。本發明提出了基于情感原因本體模型,該模型以ABC本體為基礎,通過融合情感原因領域中情感事件、情感原因、人、地域、行為概念與概念之間的關系對基礎本體模型進行拓展。然后構建了基于情感原因標注語料庫,定義了情感原因事件形式化表達,實現了基于支持向量機算法的情感原因事件識別算法。主要是在情感原因本體模型進行情感原因抽取,發現文本信息中的因果關系,此方法在事件的預測、事件聚類和股市的預測中有廣泛的應用價值。
技術領域
本發明屬于自然語言處理領域,具體涉及一種基于本體模型和多核支持向量機的情感原因抽取方法,提出了情感原因本體模型,然后在此模型上利用多核支持向量機進行情感原因抽取,從而實現挖掘文本信息中激發情感產生和轉移的觸發事件。
背景技術
隨著社交網絡平臺的快速增長,越來越多的人傾向于在社交網絡上表達他們的情感,目前文本情感計算的相關研究主要包括情緒分析、情緒原因識別、情緒預測等,其中文本情感分析的研究起步最早,研究最多,情感原因抽取的研究起步較晚。但是抽取情感原因對情監控具有深遠的意義,例如,面對突發事件,想知道民眾的情感和產生情感的原因,依次為根據進而了解輿情走向;電影制作商想知道觀影人的情感及其情感原因,從而制造出觀影人更喜歡的電影。本部分主要是介紹情感原因挖掘的研究現狀。
SophiaM.Y.Lee[1]第一次提出情感原因挖掘這個概念,即觸發情緒產生的事件,具體表現為發生的某種狀況、出現的某種情形或具體對象,可以是瞬時的,也可以是持續性的。相關的研究方案也是由語言學規則進行驅動,針對新聞文本中的情緒表達抽取其對應的原因。隨著研究的深入,開始出現一些基于機器學習模型的方法,把情感原因抽取的問題轉化為原因候選的分類問題。Chen[2]等提出了一種多標簽方法來實現情緒原因的探測,這種方法不僅可以發現跨子句的原因,還能提供有用的長距離的原因信息。Gui[3]等首次嘗試挖掘微博文本中情緒原因信息,分別采用了基于規則的方法和基于機器學習的方法。
參考文獻:
[1]Sophia Yat Mei Lee,YingChen,and Chu-Ren Huang.2010.A text-drivenrule-based system for emotioncause detection.In Coling 2010,Beijing,China.
[2]Chen Y,Lee S Y M,Li S,et al.Emotion Cause Detection withLinguistic Constructions[C]//Proceedings of the 23rd International Conferenceon Computational Linguistics,Beijing,2010:179-187.
[3]Lin Gui,Dongyin Wu,YuZhou,Qin Lu and RuifengXu.2016.Event-DrivenEmotion Cause Extraction withCorpus Construction,in Proceedings of EmpiricalMethods for Natural LanguageProcessing(EMNLP),pp.1639-1649.
發明內容
本發明的目的在于克服現有技術的不足,提出一種基于本體模型和多核支持向量機的情感原因抽取方法。
本發明為解決背景技術中提出的技術問題,所采用的技術方案如下:基于本體模型和多核支持向量機的情感原因抽取方法,該方法主要步驟為:首先構建情感原因語料庫,然后根據ABC本體模型構建情感原因本體模型,最后在此模型上基于支持向量機算法對情感原因事件進行識別。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津大學,未經天津大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811303734.1/2.html,轉載請聲明來源鉆瓜專利網。





