[發明專利]一種基于多層次語義膠囊路由的反諷檢測方法有效
| 申請號: | 202010141031.4 | 申請日: | 2020-03-03 |
| 公開(公告)號: | CN111507101B | 公開(公告)日: | 2020-12-15 |
| 發明(設計)人: | 姜明;吳俊磊;張旻;湯景凡 | 申請(專利權)人: | 杭州電子科技大學 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F40/30;G06F16/33;G06F16/35;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 杭州君度專利代理事務所(特殊普通合伙) 33240 | 代理人: | 朱月芬 |
| 地址: | 310018 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 多層次 語義 膠囊 路由 反諷 檢測 方法 | ||
1.一種基于多層次語義膠囊路由的反諷檢測方法,其特征在于包括如下步驟:
步驟(1)使用GloVe對網絡評論和上下文進行詞向量嵌入,分別獲得網絡評論的文本特征和上下文的文本特征;
步驟(2)分別將網絡評論和上下文的文本特征輸入到Transformer模型中進行向量的轉換,分別獲得網絡評論的隱藏層特征和上下文的隱藏層特征;
步驟(3)通過CNN把網絡評論的隱藏層特征轉化為網絡評論的池化特征;
步驟(4)把池化特征作為權重使用注意力機制對上下文的隱藏層特征進行權重偏移,獲得新的隱藏層特征Ⅰ;
步驟(5)把網絡評論的隱藏層特征與SenticNet中獲得的情感權重相結合,獲得新的隱藏層特征Ⅱ;
步驟(6)把隱藏層特征Ⅰ和Ⅱ作為低層次的語義膠囊,進行EM路由獲得高層次的語義膠囊;
步驟(7)最后把高層次的語義膠囊通過SoftMax函數獲得最后的分類結果。
2.根據權利要求1所述的一種基于多層次語義膠囊路由的反諷檢測方法,其特征在于步驟(1)具體:使用glove.840B.300d的詞向量文件把SARC數據集中的網絡評論和上下文進行詞向量嵌入,獲得一個維度為300維的詞向量矩陣。
3.根據權利要求2所述的一種基于多層次語義膠囊路由的反諷檢測方法,其特征在于步驟(3)中,利用CNN網絡模型對步驟(2)獲得的網絡評論的隱藏層特征進行Max-pooling操作,獲得網絡評論的池化特征。
4.根據權利要求3所述的一種基于多層次語義膠囊路由的反諷檢測方法,其特征在于步驟(4)所述的把網絡評論的池化特征作為權重使用注意力機制對上下文的隱藏層特征進行權重偏移,獲得新的隱藏層特征Ⅰ,具體實現如下:
4-1.使用網絡評論的池化特征對上下文的隱藏層特征進行詞向量的偏移,具體:使用縮放點積的注意力機制,將注意力機制描述為將query和key映射到單詞級別的權重上;
query包括上下文的隱藏層特征的平均向量qC,以及網絡評論的池化特征的平均向量qS,通過可訓練的參數轉化為dk維:
key包括上下文的隱藏層特征和網絡評論的池化特征,通過可訓練的參數轉化為dk維:
其中,是上下文的隱藏層特征,是網絡評論的池化特征,它們的向量維度都是2dl;的向量維度是2dl*dk;
4-2.網絡評論和上下文的交互注意力權重計算如下:
為了確保的每個維度之間的參數差距比較大,引入作為比例因子;
4-3.根據公式(12)獲得新的隱藏層特征I;
5.根據權利要求4所述的一種基于多層次語義膠囊路由的反諷檢測方法,其特征在于步驟(5)把池化特征與SenticNet中獲得的情感權重相結合,獲得新的隱藏層特征II,具體如下:
使用SenticNet獲得網絡評論中每個單詞對應的情感權重,然后使用注意力機制把網絡評論的情感權重與步驟(2)中獲得的網絡評論的隱藏層特征進行權重偏移,獲得新的隱藏層特征II。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州電子科技大學,未經杭州電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010141031.4/1.html,轉載請聲明來源鉆瓜專利網。





