[發(fā)明專利]一種文本情緒分析方法、裝置及設(shè)備在審
| 申請?zhí)枺?/td> | 201910554005.1 | 申請日: | 2019-06-25 |
| 公開(公告)號: | CN110276076A | 公開(公告)日: | 2019-09-24 |
| 發(fā)明(設(shè)計)人: | 單斌 | 申請(專利權(quán))人: | 北京奇藝世紀科技有限公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06F16/35;G06N3/04 |
| 代理公司: | 北京集佳知識產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 王嬌嬌 |
| 地址: | 100080 北京市海淀*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 文本 情緒 分類模型 分類網(wǎng)絡(luò) 情緒分析 文本向量 裝置及設(shè)備 特征提取 語義特征 細粒度 向量 文本訓(xùn)練 文本轉(zhuǎn)換 樣本訓(xùn)練 語義內(nèi)容 輸出 網(wǎng)絡(luò) 應(yīng)用 分析 | ||
1.一種文本情緒分析方法,其特征在于,包括:
基于詞向量模型,將所述待處理文本映射為文本向量;
基于預(yù)先訓(xùn)練得到的文本情緒分類模型中基于注意力機制的單層雙向GRU網(wǎng)絡(luò),從所述文本向量中提取得到語義特征向量;
基于所述文本情緒分類模型中的分類網(wǎng)絡(luò),對所述語義特征向量進行分析得到所述待處理文本所屬的目標情緒類別。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述基于所述文本情緒分類模型中的分類網(wǎng)絡(luò),對所述語義特征向量進行分析得到所述待處理文本所屬的目標情緒類別,包括:
基于所述分類網(wǎng)絡(luò),分析所述語義特征向量得到所述待處理文本屬于各個預(yù)設(shè)情緒類別的置信度;
選取置信度最大的預(yù)設(shè)情緒類別為所述待處理文本所屬的目標情緒類別。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,訓(xùn)練所述文本情緒分類模型的過程,包括:
獲取標注有預(yù)設(shè)情緒類別的文本訓(xùn)練樣本;
基于詞向量模型將所述文本訓(xùn)練樣本轉(zhuǎn)換為對應(yīng)的文本訓(xùn)練樣本向量;
基于預(yù)設(shè)文本情緒分類模型中的基于注意力機制的單層雙向GRU網(wǎng)絡(luò),從所述文本訓(xùn)練樣本向量中提取得到語義特征向量;
基于所述預(yù)設(shè)文本情緒分類模型中的分類網(wǎng)絡(luò),對所述文本訓(xùn)練樣本向量的語義特征向量進行分析得到所述文本訓(xùn)練樣本所屬情緒類別的分類結(jié)果;
基于所述文本訓(xùn)練樣本的分類結(jié)果和標注類別,調(diào)整所述預(yù)設(shè)文本情緒分類模型中的模型參數(shù),直到利用調(diào)整后的文本情緒分類模型分析所述文本訓(xùn)練樣本得到的分類結(jié)果滿足預(yù)設(shè)收斂條件,得到所述文本情緒分類模型。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述獲取已標注情緒類別的文本訓(xùn)練樣本,包括:
獲取預(yù)標注數(shù)據(jù),所述預(yù)標注數(shù)據(jù)中包含表征文本情緒的情緒標識;
利用所述預(yù)標注數(shù)據(jù)訓(xùn)練預(yù)設(shè)文本情緒分類模型得到基礎(chǔ)分類模型;
基于所述基礎(chǔ)分類模型獲得各個候選文本訓(xùn)練樣本所屬情緒類別的置信度;
依據(jù)各個候選文本訓(xùn)練樣本所屬情緒類別的置信度,從所述各個候選文本訓(xùn)練樣本中選取得到所述文本訓(xùn)練樣本。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述依據(jù)各個候選文本訓(xùn)練樣本所屬情緒類別的置信度,從所述各個候選文本訓(xùn)練樣本中選取得到所述文本訓(xùn)練樣本,包括:
選取分類結(jié)果中最大置信度大于置信度閾值的候選文本訓(xùn)練樣本為所述文本訓(xùn)練樣本。
6.一種文本情緒分析裝置,其特征在于,包括:
向量轉(zhuǎn)換模塊,用于基于詞向量模型,將所述待處理文本映射為文本向量;
特征提取模塊,用于基于預(yù)先訓(xùn)練得到的文本情緒分類模型中基于注意力機制的單層雙向GRU網(wǎng)絡(luò),從所述文本向量中提取得到語義特征向量;
分類模塊,用于基于所述文本情緒分類模型中的分類網(wǎng)絡(luò),對所述語義特征向量進行分析得到所述待處理文本所屬的目標情緒類別。
7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述分類模塊包括:
置信度獲取子模塊,用于基于所述分類網(wǎng)絡(luò),分析所述語義特征向量得到所述待處理文本屬于各個預(yù)設(shè)情緒類別的置信度;
選取子模塊,用于選取置信度最大的預(yù)設(shè)情緒類別為所述待處理文本所屬的目標情緒類別。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京奇藝世紀科技有限公司,未經(jīng)北京奇藝世紀科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910554005.1/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 使用大型數(shù)據(jù)庫進行對象識別的系統(tǒng)及方法
- 一種圖像分類方法及裝置
- 分類模型訓(xùn)練方法及裝置
- 文本分類號的確定方法、裝置以及電子設(shè)備
- 文本分類方法、裝置、設(shè)備及計算機可讀存儲介質(zhì)
- 圖像分類模型的訓(xùn)練、圖像分類方法、裝置、設(shè)備及介質(zhì)
- 基于深度學(xué)習(xí)的圖像分類方法、裝置、服務(wù)器及介質(zhì)
- 模型生成方法、文本分類方法、裝置、設(shè)備及介質(zhì)
- 一種數(shù)據(jù)分類方法、裝置及系統(tǒng)
- 一種從局部到整體感知的電網(wǎng)場景預(yù)警分類方法及系統(tǒng)
- 基于隨機抽樣多分類器的網(wǎng)絡(luò)流量識別方法
- 網(wǎng)絡(luò)流早期分類
- 一種網(wǎng)絡(luò)產(chǎn)品功能的分類方法和分類系統(tǒng)
- 圖像分類方法、裝置、計算機設(shè)備和存儲介質(zhì)
- 基于空域分類網(wǎng)絡(luò)和時域分類網(wǎng)絡(luò)融合的視頻分類方法
- 基于卷積神經(jīng)網(wǎng)絡(luò)和非局部連接網(wǎng)絡(luò)的圖像分類方法
- 一種基于神經(jīng)網(wǎng)絡(luò)的文本分類方法和裝置
- 針對高斯分類神經(jīng)網(wǎng)絡(luò)進行強化訓(xùn)練的方法及設(shè)備
- 圖像分類方法、系統(tǒng)、計算機設(shè)備及存儲介質(zhì)
- 一種網(wǎng)絡(luò)流量分類方法和系統(tǒng)





