[發明專利]一種基于非結構情感分析的句法分析情感標簽抽取方法在審
| 申請號: | 202210063013.8 | 申請日: | 2022-01-20 |
| 公開(公告)號: | CN114429120A | 公開(公告)日: | 2022-05-03 |
| 發明(設計)人: | 洪芳華 | 申請(專利權)人: | 洪芳華 |
| 主分類號: | G06F40/211 | 分類號: | G06F40/211;G06F40/253;G06F40/284 |
| 代理公司: | 北京智行陽光知識產權代理事務所(普通合伙) 11738 | 代理人: | 魏毅凡 |
| 地址: | 230031 安徽省合肥*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 結構 情感 分析 句法 標簽 抽取 方法 | ||
本發明涉及計算機語言處理技術領域,且公開了一種基于非結構情感分析的句法分析情感標簽抽取方法,包括句法解析、情感標簽抽取、情感標簽過濾、構建情感傾向性分析模型、情感傾向性分析、構建情感因子詞庫、評價對象抽取。該基于非結構情感分析的句法分析情感標簽抽取方法,利用情感因子詞匯標簽獲取,對候選情感原因子與關于情感因子描繪進行收集匯總,將收集到的情感因子詞匯匯總然后進行情感標簽過濾,過濾掉不屬于相關情感標簽,在抽取情感標簽因子前將情感標簽因子進行歸納、篩選從而可以大大地減少抽取無效情感因子標簽的概率,句法分析情感標簽抽取前,通過歸納收集抽取大大提高情感標簽抽取效率。
技術領域
本發明涉及計算機語言處理技術領域,具體為一種基于非結構情感分析的句法分析情感標簽抽取方法。
背景技術
計算機語言指用于人與計算機之間通訊的語言,計算機語言是人與計算機之間傳遞信息的媒介,計算機系統最大特征是指令通過一種語言傳達給機器,為了使電子計算機進行各種工作,就需要有一套用以編寫計算機程序的數字、字符和語法規劃,由這些字符和語法規則組成計算機各種指令(或各種語句),這些就是計算機能接受的語言,計算機語言處理中包含一種句法情感標簽,隨著計算機的深入研究關于情感標簽抽取的工作凸顯出許多問題,其中情感標簽的抽取工作量大,效率較低,影響正常使用,為此現提出一種基于非結構情感分析的句法分析情感標簽抽取方法來解決上述問題。
發明內容
(一)解決的技術問題
針對現有技術的不足,本發明提供了一種基于非結構情感分析的句法分析情感標簽抽取方法,具備通過歸納收集抽取大大提高情感標簽抽取效率,優點,解決了情感標簽的抽取工作量大,效率較低,影響正常使用的問題。
(二)技術方案
為實現上述目的,本發明提供如下技術方案:一種基于非結構情感分析的句法分析情感標簽抽取方法,包括句法解析、情感標簽抽取、情感標簽過濾、構建情感傾向性分析模型、情感傾向性分析、構建情感因子詞庫、評價對象抽取;
所述句法分析情感標簽獲取包含以下步驟:
S100、情感因子詞匯標簽獲取,對候選情感原因子與關于情感因子描繪進行收集匯總;
S101、將收集到的情感因子詞匯匯總然后進行情感標簽過濾,過濾掉不屬于相關情感標簽;
S102、進而構建情感因子詞匯詞庫;
S103、從情感因子詞匯詞庫中抽取評價對象;
S104、對所述評價對象的目標特性進行分析,獲得情感因子標簽;
S105、構建情感因子傾向性分析模型,對情感因子標簽進行分析;
所述句法分析情感標簽抽取方法包含以下步驟:
S200、構建抽取模型,與句法依賴關系樹;
S200、將需要抽取的句法解析與關系樹一一對應;
S200、從關系樹中抽取情感標簽,根據情感極性值計算和情感詞組特征對情感標簽進行篩選,進而生成情感標簽。
優選的,所述句法分析主要的應用在于中文信息處理中,它是語塊分析思想的一個直接實現,句法分析通過識別出高層次的結構單元來簡化句子的描述,從而能夠更快地篩選情感因子。
優選的,所述評價對象抽取包含基于尋找頻繁出現的名詞和名詞詞組的抽取方法、利用觀點和評價對象關系的抽取方法、使用有監督學習進行抽取的方法、使用主題模型進行抽取的方法、情感傾向性分析、基于有監督學習的情感傾向性分析、基于詞典的情感傾向性分析。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于洪芳華,未經洪芳華許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210063013.8/2.html,轉載請聲明來源鉆瓜專利網。





