[發明專利]一種基于多層次語義膠囊路由的反諷檢測方法有效
| 申請號: | 202010141031.4 | 申請日: | 2020-03-03 |
| 公開(公告)號: | CN111507101B | 公開(公告)日: | 2020-12-15 |
| 發明(設計)人: | 姜明;吳俊磊;張旻;湯景凡 | 申請(專利權)人: | 杭州電子科技大學 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F40/30;G06F16/33;G06F16/35;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 杭州君度專利代理事務所(特殊普通合伙) 33240 | 代理人: | 朱月芬 |
| 地址: | 310018 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 多層次 語義 膠囊 路由 反諷 檢測 方法 | ||
本發明公開了一種基于多層次語義膠囊路由的反諷檢測方法。本發明步驟:使用GloVe對網絡評論和上下文進行詞向量嵌入,分別獲得網絡評論和上下文的文本特征;并將文本特征輸入到Transformer模型中進行向量的轉換,分別獲得網絡評論和上下文的隱藏層特征;通過CNN把網絡評論的隱藏層特征轉化為網絡評論的池化特征;把池化特征作為權重使用注意力機制對上下文的隱藏層特征進行權重偏移,獲得新的隱藏層特征Ⅰ;把網絡評論的隱藏層特征與SenticNet中獲得的情感權重相結合,獲得新的隱藏層特征Ⅱ;把隱藏層特征Ⅰ和Ⅱ作為低層次的語義膠囊,進行EM路由獲得高層次的語義膠囊;最后把高層次的語義膠囊通過SoftMax函數獲得最后的分類結果。本發明有效解決了反諷檢測分類效果不佳等問題。
技術領域
本發明涉及自然語言處理的反諷檢測領域,具體涉及基于多層次語義膠囊路由的反諷檢測方法。
背景技術
自動諷刺檢測的文獻分別集中于文本的詞法、句法和語義層面的分析或者通過上下文假設、背景或常識來捕獲用戶的風格和個性描述。但是,在一組表示反諷的文本中,通常包含言語和情景兩種類型的反諷文本。我們提出了一個基于多層次語義膠囊路由的反諷檢測方法,用于在線社交媒體評論的反諷檢測。對于前者,我們認為單個句子包含強烈的情感變化。因此,我們往句子上的每個單詞上都通過SenticNet附加了情感權重。同樣,有的時候單個句子無法判斷是否包含反諷。為了讓句子和上下文進行信息交互,我們使用局部注意力機制,從上下文獲取用戶的個性特征,從而對句子進行反諷檢測。最后,我們通過語義膠囊路由來實現兩種反諷檢測方式的結合。
發明內容
本發明的目的是針對現有技術的不足,以解決反諷檢測分類效果不佳等問題,提供一種基于多層次語義膠囊路由的反諷檢測方法。
為實現以上的技術目的,本發明將采取以下技術方案:
一種基于多層次語義膠囊路由的反諷檢測方法,按照如下步驟進行:
步驟(1)使用GloVe對網絡評論和上下文進行詞向量嵌入,分別獲得網絡評論的文本特征和上下文的文本特征;
步驟(2)分別將網絡評論和上下文的文本特征輸入到Transformer模型中進行向量的轉換,分別獲得網絡評論和上下文隱藏層特征;
步驟(3)通過CNN把獲得網絡評論的隱藏層特征轉化為網絡評論的池化特征;
步驟(4)把池化特征作為權重使用注意力機制對上下文的隱藏層特征進行權重偏移,獲得新的隱藏層特征Ⅰ;
步驟(5)把網絡評論的隱藏層特征與SenticNet中獲得情感權重相結合,獲得新的隱藏層特征Ⅱ;
步驟(6)把隱藏層特征Ⅰ和Ⅱ作為低層次的語義膠囊,進行EM路由獲得高層次的語義膠囊;
步驟(7)把高層次的語義膠囊通過SoftMax獲得最后的分類結果。
其中步驟(2),Transformer模型在得到文本的詞向量的過程中,還需要獲得文本詞向量的相對位置。
本發明進一步限定的技術方案為:
進一步的,步驟(1)具體為:使用glove.840B.300d的詞向量文件把SARC數據集中的網絡評論和上下文進行詞向量嵌入,獲得一個維度為300維的詞向量矩陣;
進一步的,步驟(2)具體為:把網絡評論和上下文的文本特征輸入到Transformer模型中獲得上下文相關的網絡評論和上下文的隱藏層特征;
進一步的,步驟(3)中,利用CNN網絡模型對步驟(2)獲得網絡評論的隱藏層特征進行Max-pooling操作,獲得網絡評論的池化特征;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州電子科技大學,未經杭州電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010141031.4/2.html,轉載請聲明來源鉆瓜專利網。





