[發明專利]深層情感語義識別方法、系統、介質、計算機設備及終端在審
| 申請號: | 202011363004.8 | 申請日: | 2020-11-27 |
| 公開(公告)號: | CN112528668A | 公開(公告)日: | 2021-03-19 |
| 發明(設計)人: | 游蘭;彭慶喜 | 申請(專利權)人: | 湖北大學 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06K9/62 |
| 代理公司: | 北京金智普華知識產權代理有限公司 11401 | 代理人: | 楊采良 |
| 地址: | 430062 湖北*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 深層 情感 語義 識別 方法 系統 介質 計算機 設備 終端 | ||
1.一種深層情感語義識別方法,其特征在于,所述深層情感語義識別方法包括:
采集樣本數據,構建訓練語料庫;對訓練語料庫中的樣本數據進行分析,采用不同的參數通過Bagging并行訓練得到多個不同BERT預訓練模型;
采用得到的多個不同BERT預訓練模型分別獲取文本的雙向語義詞向量表示;
通過雙向GRU模型基于獲取的雙向語義詞向量表示提取文本上下文的全局語義特征;
對提取的全局語義特征進行融合,將多維度特征轉換為一維的特征向量;
基于得到的一維特征向量利用softmax函數識別文本的情感類別。
2.如權利要求1所述深層情感語義識別方法,其特征在于,所述參數包括但不限于:學習率、訓練批次、文本切分長度。
3.如權利要求1所述深層情感語義識別方法,其特征在于,所述采用得到的多個不同BERT預訓練模型分別獲取文本的雙向語義詞向量表示包括:
確定文本長度,并判斷文本長度是否大于n,如果文本長度大于n,則只輸出前n長度的文本語義表示;如果文本長度小于n,則利用BERT模型得到的小于n的輸出文本語義表示進行填充,填充多個m維零向量直至輸出序列長度為n。
4.如權利要求1所述深層情感語義識別方法,其特征在于,所述通過雙向GRU模型基于獲取的雙向語義詞向量表示提取文本上下文的全局語義特征包括:
(1)將獲取的雙向語義詞向量表示通過正向獲取到所有過去時間序列中的完整上下文信息,再通過反向獲取所有未來時間序列的完整上下文,計算公式如下:
其中,w表示連接兩層的權重,b表示偏置向量,f表示激活函數,和分別表示正向GRU和負向GRU輸出;
(2)雙向GRU在正負向的隱藏層上對輸入表示dn進行計算,得到dn隱藏狀態ht,將正負GRU采用拼接策略:
得到這個雙向GRU的隱藏狀態,計算公式如下:
H=(h1,h2,...,hd)。
5.一種深層情感語義識別系統,其特征在于,所述深層情感語義識別系統包括:
語義輸出模塊,用于對訓練語料庫進行分析,輸出文本語義表示;
向量表示提取模塊,用于利用多個不同的中文BERT預訓練模型獲取文本的雙向語義詞向量表示;
特征提取模塊,用于基于獲取的雙向語義詞向量表示利用雙向GRU模型提取上下文的全局語義特征;
池化層,用于整合全局信息,將多維度特征轉換為一維的特征向量;
分類識別層,用于基于得到的一維特征向量利用softmax函數識別文本的情感類別。
6.如權利要求5所述深層情感語義識別系統,其特征在于,所述雙向GRU模型包括:
所述雙向GRU模型,用于利用整個文本序列的信息對每個詞進行處理;所述文本序列的信息包括各個詞之間的相互關系信息;
每個GRU單元均包含更新門、重置門和輸出門三種門結構;用于保持和更新狀態信息并進行傳遞;
更新門,用于確定丟棄的信息以及新添加的信息;
重置門,用于確定丟棄的先前信息的數量;
輸出門,用于決定輸出單元狀態。
7.一種計算機設備,其特征在于,所述計算機設備包括存儲器和處理器,所述存儲器存儲有計算機程序,所述計算機程序被所述處理器執行時,使得所述處理器執行如下步驟:
采集樣本數據,構建訓練語料庫;對訓練語料庫中的樣本數據進行分析,采用不同的參數通過Bagging并行訓練得到多個不同BERT預訓練模型;
采用得到的多個不同BERT預訓練模型分別獲取文本的雙向語義詞向量表示;
通過雙向GRU模型基于獲取的雙向語義詞向量表示提取文本上下文的全局語義特征;
對提取的全局語義特征進行融合,將多維度特征轉換為一維的特征向量;
基于得到的一維特征向量利用softmax函數識別文本的情感類別。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于湖北大學,未經湖北大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011363004.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:文本行校正方法和裝置
- 下一篇:石油鉆井機





