[發明專利]基于CNN的方面級跨領域情感分析方法有效
| 申請號: | 202011026500.4 | 申請日: | 2020-09-25 |
| 公開(公告)號: | CN112163091B | 公開(公告)日: | 2023-08-22 |
| 發明(設計)人: | 孟佳娜;于玉海;吳詩涵 | 申請(專利權)人: | 大連民族大學 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/30;G06F40/211;G06F40/289;G06N3/0464;G06N3/08 |
| 代理公司: | 大連智高專利事務所(特殊普通合伙) 21235 | 代理人: | 畢進 |
| 地址: | 116600 遼寧省*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 cnn 方面 領域 情感 分析 方法 | ||
基于CNN的方面級跨領域情感分析方法,屬于文本情感分析領域,為了解決獲得好的情感分析分類結果的問題,包括S1.構建方面級情感分析模型,S2.方面級跨領域情感分析,效果是將上下文特征與句子特征進行融合,構建了基于卷積神經網絡的方面級情感分類模型,并將源領域訓練好的模型遷移到目標領域,對目標領域的數據進行方面級情感分析。
技術領域
本發明屬于文本情感分析領域,涉及一種基于CNN的方面級跨領域情感分析方法。
背景技術
情感分析有著廣泛的應用價值,是自然語言處理領域一項具有挑戰的任務,也是最活躍的研究方向之一。根據現有的研究,情感分析可以分為三個級別:文檔級、句子級和方面級。文檔級和句子級的情感分析都是粗粒度的情感分析,而方面級情感分析是一種細粒度的情感分析,相比于一般的情感分析,它可以提供更詳細的情感分析結果。針對方面級情感分析問題,目前已經有很多先進的深度學習方法,但是常用的深度學習模型一般高度依賴大量的已標注數據進行訓練,而人工標注數據需要耗費許多時間和金錢來完成。
早期對于方面級的情感分析主要依靠特征工程來表征句子,近年來在方面級情感分析任務中,深度學習模型取得了更好的效果。長短期記憶網絡(LSTM)具有良好的表示序列信息的能力,Tang等人使用兩個LSTM將目標詞語與其上下文共同建模,整合了目標詞語與上下文的相互關聯信息。Tai等人提出了樹形LSTM結構,結合依存關系、短語構成等語法特性,使得語義表達更加準確。注意力機制可以有效提高情感分類的效果。Ma等人提出了一種分層注意力機制的LSTM結構,將情感相關概念的常識性知識引入到深度神經網絡端到端的訓練中。Ma等人提出了一種交互式注意力網絡,交互檢測目標的重要單詞和上下文中的重要單詞。記憶網絡模型擁有長期、大量和易于讀寫的記憶。Tang等人用上下文信息構建記憶網絡,通過注意力機制捕獲對不同方面情感傾向比較重要的信息。Peng等人提出的RAM模型可以捕捉長距離的情感特征,并且將多重注意力的結果與RNN進行非線性組合,以提取更加復雜的特征。CNN模型比較擅長從n-gram中提取特征,Li等人的TNet模型提出了一個特征變換組件來將實體信息引入到單詞的語義表示當中,又提出了一種“上下文保留”機制,可將帶有上下文信息的特征和變換之后的特征結合起來。Wei等人將CNN與門控機制相結合,使模型可以根據給定的不同方面,有選擇地輸出情感特征。
遷移學習方法的核心思想是找到源領域(Source?Domain)和目標領域(TargetDomain)之間的相似性,并從相似性的角度將源領域使用的模型或標記數據遷移到目標領域,最后根據已有的相似度進行新的訓練。由于不同領域之間的特征有較大差異,許多跨領域方法都是從特征的角度入手。Blitzer等人提出結構對應學習方法,嘗試在源領域和目標領域中找到一組具有相同特征或行為的樞軸(pivot)特征進行對齊。Pan等人提出光譜特征對齊的技術將來自不同領域的領域特定詞語對齊到統一的簇中。以深度神經網絡為基礎,也延伸出許多解決跨領域的方法。Glorot等人使用了一種堆疊式降噪自動編碼器,將源領域和目標領域的特征進行重構。Chen等人提出使用mSDA(marginalized?SDA)算法,在不使用優化算法的基礎上保留了模型強大的學習能力。Yosinski等人通過實驗發現深度網絡的前幾層更適合被固定用來完成遷移學習任務,并且提出微調可以很好的克服領域間數據間的差異性。Long等人提出深度自適應網絡DAN模型,以深度網絡為載體來進行適配遷移。
目前,遷移學習在多個領域都取得了巨大的成功,例如文本挖掘、語音識別、計算機視覺、垃圾郵件過濾、WIFI定位以及情感分類任務等,具有廣闊的應用前景。方面級情感分析能提供比一般情感分析更細粒度的信息,具有更大的研究價值和商業價值。而訓練一個優秀的方面級情感分析模型需要大量的標注數據,當訓練數據不充足,分布不同或數據類別不平衡時,模型的效果會大打折扣。因此,構建跨領域情感分析技術通用的模型和方法是未來值得研究的問題。
發明內容
為了解決獲得好的情感分析分類結果的問題,本發明提出如下技術方案:一種基于CNN的方面級跨領域情感分析方法,包括
S1.構建方面級情感分析模型,
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于大連民族大學,未經大連民族大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011026500.4/2.html,轉載請聲明來源鉆瓜專利網。





