[發(fā)明專利]一種情感分類方法、裝置、電子設(shè)備和存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 201911199692.6 | 申請日: | 2019-11-29 |
| 公開(公告)號: | CN112883188A | 公開(公告)日: | 2021-06-01 |
| 發(fā)明(設(shè)計)人: | 梁天新;王炳乾 | 申請(專利權(quán))人: | 京東方科技集團(tuán)股份有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35 |
| 代理公司: | 北京風(fēng)雅頌專利代理有限公司 11403 | 代理人: | 李莎 |
| 地址: | 100015 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 情感 分類 方法 裝置 電子設(shè)備 存儲 介質(zhì) | ||
本發(fā)明提供一種情感分類方法、裝置、電子設(shè)備和存儲介質(zhì),包括:通過訓(xùn)練集訓(xùn)練串行的自然語言預(yù)訓(xùn)練模型和文本分類模型,得到情感分類組合模型;其中,所述訓(xùn)練集包括多個訓(xùn)練樣本,每個訓(xùn)練樣本包括文本、所述文本中的方面詞和所述方面詞的分類標(biāo)簽;將待預(yù)測文本和所述待預(yù)測文本中的方面詞輸入到所述情感分類組合模型中,以輸出所述待預(yù)測文本中的方面詞的分類標(biāo)簽。本發(fā)明將自然語言預(yù)訓(xùn)練模型和文本分類模型串行組合,通過訓(xùn)練集訓(xùn)練這兩個模型,訓(xùn)練后的組合模型能夠?qū)崿F(xiàn)基于方面詞的細(xì)粒度情感分類,從而準(zhǔn)確地對文本進(jìn)行細(xì)粒度情感分析。
技術(shù)領(lǐng)域
本發(fā)明涉及自然語言處理技術(shù)領(lǐng)域,尤其涉及一種情感分類方法、裝置、電子設(shè)備和存儲介質(zhì)。
背景技術(shù)
隨著社交網(wǎng)絡(luò)的興起,越來越多的人喜歡在網(wǎng)絡(luò)上發(fā)表自己的觀點,這種帶有個人主觀態(tài)度的文本具有很大的挖掘價值。因為用戶需求的不斷增加,句子級別的情感分析只能給出一整句話的情感值,無法準(zhǔn)確表達(dá)用戶想要知道的對象,所以情感分析粒度需要更加細(xì)化。但是,現(xiàn)有的情感分析方法無法準(zhǔn)確地對文本進(jìn)行細(xì)粒度情感分析。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明的目的在于提出一種情感分類方法、裝置、電子設(shè)備和存儲介質(zhì),以解決細(xì)粒度情感分類不夠準(zhǔn)確的技術(shù)問題。
基于上述目的,根據(jù)本發(fā)明的第一個方面,其提供了一種情感分類方法,包括:
通過訓(xùn)練集訓(xùn)練串行的自然語言預(yù)訓(xùn)練模型和文本分類模型,得到情感分類組合模型;其中,所述訓(xùn)練集包括多個訓(xùn)練樣本,每個訓(xùn)練樣本包括文本、所述文本中的方面詞和所述方面詞的分類標(biāo)簽;
將待預(yù)測文本和所述待預(yù)測文本中的方面詞輸入到所述情感分類組合模型中,以輸出所述待預(yù)測文本中的方面詞的分類標(biāo)簽。
在本發(fā)明的一些實施例中,通過訓(xùn)練集訓(xùn)練串行的自然語言預(yù)訓(xùn)練模型和文本分類模型,得到情感分類組合模型,包括:
將訓(xùn)練集輸入到自然語言預(yù)訓(xùn)練模型中,得到所述自然語言預(yù)訓(xùn)練模型輸出的第一語義特征向量;
將所述自然語言預(yù)訓(xùn)練模型輸出的第一語義特征向量輸入到文本分類模型中,得到所述文本分類模型輸出的第二語義特征向量;
根據(jù)所述文本分類模型輸出的第二語義特征向量優(yōu)化所述自然語言預(yù)訓(xùn)練模型的參數(shù)和所述文本分類模型的參數(shù),從而得到情感分類組合模型。
在本發(fā)明的一些實施例中,根據(jù)所述文本分類模型輸出的第二語義特征向量優(yōu)化所述自然語言預(yù)訓(xùn)練模型的參數(shù)和所述文本分類模型的參數(shù),從而得到情感分類組合模型,包括:
基于所述文本分類模型輸出的第二語義特征向量、所述自然語言預(yù)訓(xùn)練模型的參數(shù)和所述文本分類模型的參數(shù),計算損失函數(shù);
通過使所述損失函數(shù)取最小值,獲得所述自然語言預(yù)訓(xùn)練模型的最優(yōu)參數(shù)和所述文本分類模型的最優(yōu)參數(shù),從而得到情感分類組合模型。
在本發(fā)明的一些實施例中,所述損失函數(shù)為交叉熵?fù)p失函數(shù)。
在本發(fā)明的一些實施例中,所述自然語言預(yù)訓(xùn)練模型為BERT模型,和/或,所述文本分類模型為TextCNN模型。
根據(jù)本發(fā)明的第二個方面,其提供了一種情感分類裝置,包括:
訓(xùn)練模塊,被配置為:通過訓(xùn)練集訓(xùn)練串行的自然語言預(yù)訓(xùn)練模型和文本分類模型,得到情感分類組合模型;其中,所述訓(xùn)練集包括多個訓(xùn)練樣本,每個訓(xùn)練樣本包括文本、所述文本中的方面詞和所述方面詞的分類標(biāo)簽;
預(yù)測模塊,被配置為:將待預(yù)測文本和所述待預(yù)測文本中的方面詞輸入到所述情感分類組合模型中,以輸出所述待預(yù)測文本中的方面詞的分類標(biāo)簽。
在本發(fā)明的一些實施例中,所述訓(xùn)練模塊還用于:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于京東方科技集團(tuán)股份有限公司,未經(jīng)京東方科技集團(tuán)股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911199692.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





