[發明專利]一種基于語義本體庫中文文本情感分析方法有效
| 申請號: | 201710841831.5 | 申請日: | 2017-09-18 |
| 公開(公告)號: | CN107609132B | 公開(公告)日: | 2020-03-20 |
| 發明(設計)人: | 姜明;楊智聰;張旻;湯景凡;程柳;杜煉 | 申請(專利權)人: | 杭州電子科技大學 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/289;G06F40/30;G06F40/247;G06K9/62 |
| 代理公司: | 杭州君度專利代理事務所(特殊普通合伙) 33240 | 代理人: | 朱月芬 |
| 地址: | 310018 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 語義 本體 中文 文本 情感 分析 方法 | ||
本發明公開了一種基于語義本體庫中文文本情感分析方法。本發明步驟如下:步驟1、獲取關于目標對象一定數量的結構化評論組成待分析的語料庫,根據權威機構提供的情感本體庫,結合語料庫通過語義分析泛化得到情感本體庫,情感本體庫包含情感極限和情感程度;步驟2、對情感詞匹配和情感詞關系預處理,將語料庫進行分詞、文本分析、匹配本體庫和評論句子中情感詞,標注情感詞的情感信息以及上下文對應的依存關系。其中,情感信息包含詞的情感強度、情感極性和情感詞詞性;步驟3、情感計算和情感傾向判斷。本發明能更精確的根據上下文進行情感分類。
技術領域
本發明屬于自然語言處理領域,特別涉及中文文本情感分析方法,提供一種基于語義本體庫中文文本情感分析方法。
背景技術
隨著互聯網技術的快速發展,互聯網上(包括門戶網站、電子商務網站、社交網站、音/視頻分享網站、論壇、博客、微博等)產生了海量的、由用戶發表的對于諸如人物、事件、產品等目標實體的評論信息。與客觀性文本不同的是,這些主觀色彩濃厚的評論信息蘊含著大眾輿論對上述目標實體的看法,對潛在用戶、商家以及政府部門等具有十分重要的參考價值。然而,如果采用人工方式對這些海量信息進行收集和分析,顯然是成本高昂、低效和困難的。利用計算機對非結構化的文本評論進行分類和提取的文本情感分析技術應運而生。
目前,國內外使用最多的文本情感分析方式有兩種,一是基于機器學習的情感分析;二是基于語義規則的情感分析。機器學習方法包括有監督、無監督和半監督情感分析,其中有監督和半監督的機器學習方法中分類起的訓練需要一定數量經過標注的訓練樣本,然而人工標注過程相當耗時費力,成本昂貴,無監督學習則是無需標注的。基于語義規則的文本傾向性研究中,研究者一般考慮詞語,句子,段落和篇章等多個角度自底向上進行層次分析。通過規則計算情感詞匯情感值,得到句子、段落以及篇章的整體情感值,從而獲得最終的情感傾向信息。
傳統的基于機器學習特征抽取SVM情感分類會出現上下文語義缺失,而本方法利用句法規則可以在結合語義前提進行情感分析,然后再結合SVM分類器,從而能更精確根據上下文進行情感分類。
發明內容
本發明針對現有技術中均存在情感分析方法的不足,提供了一種基于語義本體庫中文文本情感分析方法,對中文文本進行更準確的判斷。
本發明解決其技術問題所采用的技術方案具體包括以下步驟:
步驟1、獲取關于目標對象一定數量的結構化評論組成待分析的語料庫,根據權威機構提供的情感本體庫,結合語料庫通過語義分析泛化得到情感本體庫,情感本體庫包含情感極限和情感程度;
步驟2、對情感詞匹配和情感詞關系預處理,將語料庫進行分詞、文本分析、匹配本體庫和評論句子中情感詞,標注情感詞的情感信息以及上下文對應的依存關系。其中,情感信息包含詞的情感強度、情感極性和情感詞詞性;
步驟3、情感計算和情感傾向判斷;
根據評論中情感信息以及依存關系,結合系統規則進行情感值計算,確定評論的情感傾向再結合機器學習方法二次處理,得到最終情感傾向結果;
進一步地,根據步驟1所述情感本體庫構建,具體步驟如下:
步驟1-1.使用網絡機構中現有權威的情感本體庫,去掉重復詞之后作為原始本體庫。;
步驟1-2.從知網中下載同義詞林,將原始本體庫進行同義擴充;
步驟1-3.為了得到豐富的情感本體庫,引入word2vec工具,該工具能根據輸入樣本泛化推理得到和情感詞語義相似的詞。首先,將評論數據通過word2vec訓練,得到向量空間,將本體庫內情感詞輸入與樣本空間中的詞做相似計算,取出相似排名靠前的5個相似詞。使用SO_PMI公式分別計算本體庫情感詞和篩選出的相似詞的相關度,篩選得到更為豐富的情感本體庫。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州電子科技大學,未經杭州電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710841831.5/2.html,轉載請聲明來源鉆瓜專利網。





