[發明專利]基于自注意力機制的情感分類方法在審
| 申請號: | 201910573709.3 | 申請日: | 2019-06-28 |
| 公開(公告)號: | CN110347831A | 公開(公告)日: | 2019-10-18 |
| 發明(設計)人: | 姚全珠;祝元博;費蓉;趙佳瑜;呂鵬 | 申請(專利權)人: | 西安理工大學 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F17/27;G06N3/04 |
| 代理公司: | 西安弘理專利事務所 61214 | 代理人: | 王蕊轉 |
| 地址: | 710048 陜*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 注意力機制 情感分類 權重向量 詞向量 句子 相乘 記憶神經網絡 高級特征 句子輸入 人工成本 特征合并 特征向量 五層結構 一次迭代 第三層 第一層 構造層 輸出層 輸入層 網絡層 低維 構建 向量 映射 算法 耗時 詞匯 | ||
1.基于自注意力機制的情感分類方法,其特征在于,具體按照以下步驟實施:
以雙向長短期記憶神經網絡模型為基礎,結合自注意力機制構建SA-BiLSTM模型,SA-BiLSTM模型共包含五層結構:第一層為輸入層,將句子輸入到模型中;第二層為詞向量構造層,將每個詞映射到低維向量;第三層為Bi-LSTM網絡層,使用Bi-LSTM從詞向量層獲取高級特征;第四層為自注意力機制層,生成一個權重向量,通過與這個權重向量相乘,使每一次迭代中的詞匯級的特征合并為句子級的特征;第五層為輸出層,將句子級的特征向量用于情感分類任務。
2.根據權利要求1所述的基于自注意力機制的情感分類方法,其特征在于,所述SA-BiLSTM模型的為詞向量構造層具體功能如下:
對于給定包含T個詞的句子S:S=X1,X2,...,XT,每個詞Xi都轉換為實數向量wi,對于S中的每個詞,首先存在詞向量矩陣:其中V為固定大小的詞匯表,dw表示詞向量維度,Wk表示通過訓練學習得到的參數矩陣,使用詞向量矩陣Wk將每個詞轉化為詞向量表示如下:
ci=Wkvi
其中,vi表示大小為|V|的one-hot向量,
最終句子S將被轉化為一個實數矩陣,并傳遞給模型的下一層。
3.根據權利要求2所述的基于自注意力機制的情感分類方法,其特征在于,所述SA-BiLSTM模型的Bi-LSTM網絡層具體功能如下:
本模型使用的Bi-LSTM網絡層包含三種門機制,分別如下:
a.遺忘門ft,決定丟棄多少舊信息:
ft=σ(Wfxt+Ufht-1+bf)
b.輸入門ct,決定單元狀態中存儲哪些新信息:
it=σ(Wixt+Uiht+bi)
ct=ftct-1+it·Tanh(Wcxt+Ucht-1+bc)
c.輸出門ot,決定哪些信息被輸出:
ot=σ(Woxt+Uoht-1+bo)
最后,由當前單元狀態乘以輸出門的權重矩陣ot得到輸出值ht:
ht=otthanh(ct)
由于本模型采用的是雙向LSTM,在原有正向LSTM網絡層上添加一層反向LSTM層表示為:
hi表示Bi-LSTM網絡層的輸出。
4.根據權利要求3所述的基于自注意力機制的情感分類方法,其特征在于,所述SA-BiLSTM模型的自注意力機制層具體功能如下:
將上一層輸入的向量集合表示為H:[h1,h2,...,hT],其自注意力機制層的權重矩陣r由下面公式得到:
M=tanh(H)
α=softmax(wTM)
r=HαT
其中,dw為詞向量維度,wT是一個訓練學習得到的參數向量的轉置,最終用以分類的句子將表示為:
h*=tanh(r)。
5.根據權利要求4所述的基于自注意力機制的情感分類方法,其特征在于,所述SA-BiLSTM模型的輸出層具體功能如下:使用softmax分類器來預測標簽該分類器將上一層得到的狀態h*作為輸入,最終得到文本情感極性分類類別,
其中,y表示真實類別的概率,表示預測類別的概率,的值大于50%為積極情感傾向,的值小于50%為消極情感傾向。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安理工大學,未經西安理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910573709.3/1.html,轉載請聲明來源鉆瓜專利網。





