[發(fā)明專利]情感數(shù)據(jù)處理方法及裝置在審
| 申請?zhí)枺?/td> | 202011012503.2 | 申請日: | 2020-09-23 |
| 公開(公告)號: | CN112148878A | 公開(公告)日: | 2020-12-29 |
| 發(fā)明(設(shè)計(jì))人: | 郝雷光;常永炷;汪碩芃;張聰;毛曉曦;范長杰;胡志鵬 | 申請(專利權(quán))人: | 網(wǎng)易(杭州)網(wǎng)絡(luò)有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F16/33;G06F16/953 |
| 代理公司: | 北京超成律師事務(wù)所 11646 | 代理人: | 張芮 |
| 地址: | 310052 浙江省杭州*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 情感 數(shù)據(jù)處理 方法 裝置 | ||
1.一種情感數(shù)據(jù)處理方法,其特征在于,包括:
確定待預(yù)測的目標(biāo)文本以及所述目標(biāo)文本對應(yīng)的目標(biāo)實(shí)體;
判斷所述目標(biāo)文本是否為觀點(diǎn)文本,所述觀點(diǎn)文本為存在觀點(diǎn)詞的文本;
如果所述目標(biāo)文本為觀點(diǎn)文本,則提取所述目標(biāo)文本中所述目標(biāo)實(shí)體對應(yīng)的目標(biāo)觀點(diǎn)詞。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述判斷所述目標(biāo)文本是否為觀點(diǎn)文本的步驟,包括:
基于訓(xùn)練好的分類模型對所述目標(biāo)文本進(jìn)行分類,判斷所述目標(biāo)文本是否為觀點(diǎn)文本。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,還包括:
確定第一訓(xùn)練樣本,所述第一訓(xùn)練樣本包括觀點(diǎn)文本樣本和非觀點(diǎn)文本樣本,所述觀點(diǎn)文本樣本包括實(shí)體標(biāo)簽、情感傾向標(biāo)簽以及觀點(diǎn)詞標(biāo)簽,所述非觀點(diǎn)文本樣本包括實(shí)體標(biāo)簽以及非觀點(diǎn)標(biāo)簽;
基于所述第一訓(xùn)練樣本對初始分類模型進(jìn)行訓(xùn)練,得到訓(xùn)練好的分類模型。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述提取所述目標(biāo)文本中所述目標(biāo)實(shí)體對應(yīng)的觀點(diǎn)詞的步驟包括:
提取所述目標(biāo)文本中所述目標(biāo)實(shí)體對應(yīng)的觀點(diǎn)詞,確定目標(biāo)觀點(diǎn)詞以及所述目標(biāo)觀點(diǎn)詞對應(yīng)的情感傾向。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,提取所述目標(biāo)文本中所述目標(biāo)實(shí)體對應(yīng)的觀點(diǎn)詞,確定目標(biāo)觀點(diǎn)詞以及所述目標(biāo)觀點(diǎn)詞對應(yīng)的情感傾向的步驟包括:
基于預(yù)先訓(xùn)練好的提取判別模型對所述目標(biāo)文本中包括的觀點(diǎn)詞進(jìn)行提取以及對所述目標(biāo)文本的情感傾向進(jìn)行判別,得到目標(biāo)觀點(diǎn)詞以及目標(biāo)情感傾向。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,還包括:
確定第二訓(xùn)練樣本,所述第二訓(xùn)練樣本包括觀點(diǎn)文本樣本,所述觀點(diǎn)文本樣本對應(yīng)有實(shí)體標(biāo)簽、情感傾向標(biāo)簽以及觀點(diǎn)詞標(biāo)簽;
基于所述第二訓(xùn)練樣本對初始的提取判別模型進(jìn)行訓(xùn)練,得到訓(xùn)練好的提取判別模型,所述提取判別模型包括編碼層、提取層以及判別層,所述編碼層的輸出為所述提取層和所述判別層的輸入,所述提取層的輸出為觀點(diǎn)詞,所述判別層的輸出為情感傾向。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述提取判別模型對應(yīng)有損失函數(shù),所述損失函數(shù)基于第一子損失函數(shù)以及第二子損失函數(shù)確定,所述第一子損失函數(shù)對應(yīng)于所述提取層,所述第二子損失函數(shù)對應(yīng)于所述判別層。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述編碼層為雙向編碼層BERT。
9.根據(jù)權(quán)利要求5所述的方法,其特征在于,基于預(yù)先訓(xùn)練好的提取判別模型對所述目標(biāo)文本中包括的觀點(diǎn)詞進(jìn)行提取以及對所述目標(biāo)文本的情感傾向進(jìn)行判別,得到目標(biāo)觀點(diǎn)詞以及目標(biāo)情感傾向的步驟,包括:
將所述目標(biāo)文本切分為多個部分,所述多個部分包括實(shí)體左文本、實(shí)體以及實(shí)體右文本;
將所述多個部分輸出到預(yù)先訓(xùn)練好的提取判別模型,對所述目標(biāo)文本中包括的觀點(diǎn)詞進(jìn)行提取以及對所述目標(biāo)文本的情感傾向進(jìn)行判別,得到目標(biāo)觀點(diǎn)詞以及目標(biāo)情感傾向。
10.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述情感傾向包括正面、負(fù)面以及中立。
11.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述提取所述目標(biāo)文本中所述目標(biāo)實(shí)體對應(yīng)的目標(biāo)觀點(diǎn)詞的步驟包括:
基于訓(xùn)練好的提取模型對所述目標(biāo)文本中的所述目標(biāo)實(shí)體對應(yīng)的目標(biāo)觀點(diǎn)詞進(jìn)行提取。
12.根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括:
如果所述目標(biāo)文本不是觀點(diǎn)文本,則輸出所述目標(biāo)文本無觀點(diǎn)詞。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于網(wǎng)易(杭州)網(wǎng)絡(luò)有限公司,未經(jīng)網(wǎng)易(杭州)網(wǎng)絡(luò)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011012503.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)處理設(shè)備,數(shù)據(jù)處理方法,和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理電路、數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法、數(shù)據(jù)處理控制方法
- 數(shù)據(jù)處理設(shè)備、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法及計(jì)算機(jī)可讀取的記錄介質(zhì)
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序





