[發(fā)明專利]文章情感極性分析方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)在審
| 申請?zhí)枺?/td> | 202010575481.4 | 申請日: | 2020-06-22 |
| 公開(公告)號: | CN111738015A | 公開(公告)日: | 2020-10-02 |
| 發(fā)明(設(shè)計(jì))人: | 謝煒堅(jiān);黃強(qiáng) | 申請(專利權(quán))人: | 北京百度網(wǎng)訊科技有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06N3/04;G06N3/08 |
| 代理公司: | 北京市鑄成律師事務(wù)所 11313 | 代理人: | 閻敏;楊瑾瑾 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 文章 情感 極性 分析 方法 裝置 電子設(shè)備 存儲(chǔ) 介質(zhì) | ||
1.一種文章情感極性分析方法,包括:
將待分析文章的內(nèi)容進(jìn)行截?cái)啵玫酱治鑫恼碌钠?,將所述片段輸入多個(gè)預(yù)訓(xùn)練語言模型;
根據(jù)所述多個(gè)預(yù)訓(xùn)練語言模型的輸出結(jié)果,確定所述待分析文章的情感極性屬于正面、負(fù)面及中性的概率;
將所述待分析文章的情感極性屬于正面、負(fù)面及中性的概率進(jìn)行歸一化處理,得到所述待分析文章的情感極性的分析結(jié)果。
2.根據(jù)權(quán)利要求1所述的方法,其中,所述預(yù)訓(xùn)練語言模型包括:基于轉(zhuǎn)換器的雙向編碼器表征BERT模型。
3.根據(jù)權(quán)利要求1或2所述的方法,其中,所述待分析文章的片段包含所述待分析文章標(biāo)題的全部內(nèi)容,還包含所述待分析文章正文的全部或部分內(nèi)容;
將所述片段輸入三個(gè)預(yù)訓(xùn)練語言模型,并將三個(gè)第一標(biāo)簽語句分別輸入所述預(yù)訓(xùn)練語言模型;其中,所述三個(gè)第一標(biāo)簽語句分別為情感極性為正面、負(fù)面和中性的標(biāo)簽語句;
所述預(yù)訓(xùn)練語言模型的輸出結(jié)果分別對應(yīng)所述待分析文章與對應(yīng)的第一標(biāo)簽語句的情感極性匹配程度。
4.根據(jù)權(quán)利要求3所述的方法,其中,所述根據(jù)所述多個(gè)預(yù)訓(xùn)練語言模型的輸出結(jié)果,確定所述待分析文章的情感極性屬于正面、負(fù)面及中性的概率,包括:
將所述三個(gè)預(yù)訓(xùn)練語言模型的輸出結(jié)果分別輸入對應(yīng)的全連接層模塊;
所述對應(yīng)的全連接層模塊分別根據(jù)對應(yīng)的預(yù)訓(xùn)練語言模型的輸出結(jié)果,確定所述待分析文章的情感極性屬于正面、負(fù)面及中性的概率。
5.根據(jù)權(quán)利要求4所述的方法,其中,所述將所述待分析文章的情感極性屬于正面、負(fù)面及中性的概率進(jìn)行歸一化處理,得到所述待分析文章的情感極性的分析結(jié)果包括:
將所述全連接層模塊確定出的概率輸入歸一化層;
所述歸一化層對接收到的概率進(jìn)行歸一化處理,得到所述待分析文章的情感極性的分析結(jié)果。
6.根據(jù)權(quán)利要求3所述的方法,其中,所述片段的長度不超過512個(gè)字。
7.根據(jù)權(quán)利要求1或2所述的方法,其中,將所述待分析文章的內(nèi)容截?cái)酁槎鄠€(gè)片段;每個(gè)所述片段包含所述待分析文章標(biāo)題的全部內(nèi)容,還包含所述待分析文章正文的全部或部分內(nèi)容;
將所述多個(gè)片段分別輸入各自對應(yīng)的預(yù)訓(xùn)練語言模型,所述預(yù)訓(xùn)練語言模型的輸出結(jié)果分別包括各個(gè)對應(yīng)片段的語義表示。
8.根據(jù)權(quán)利要求7所述的方法,其中,根據(jù)所述多個(gè)預(yù)訓(xùn)練語言模型的輸出結(jié)果,確定所述待分析文章的情感極性屬于正面、負(fù)面及中性的概率,包括:
將所述多個(gè)片段對應(yīng)的預(yù)訓(xùn)練語言模型的輸出結(jié)果輸入篇章級編碼器;
所述篇章級編碼器根據(jù)多個(gè)所述預(yù)訓(xùn)練語言模型的輸出結(jié)果,生成針對所述待分析文章的三維向量;所述三維向量包含所述待分析文章的情感極性屬于正面、負(fù)面及中性的概率。
9.根據(jù)權(quán)利要求8所述的方法,其中,所述將所述待分析文章的情感極性屬于正面、負(fù)面及中性的概率進(jìn)行歸一化處理,得到所述待分析文章的情感極性的分析結(jié)果包括:
將所述篇章級編碼器生成的三維向量輸入歸一化層;
所述歸一化層對所述三維向量進(jìn)行歸一化處理,得到所述待分析文章的情感極性的分析結(jié)果。
10.根據(jù)權(quán)利要求9所述的方法,其中,所述篇章級編碼器包括:全連接層模塊、雙向門控循環(huán)單元BiGRU或轉(zhuǎn)換器與注意力池化模塊。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京百度網(wǎng)訊科技有限公司,未經(jīng)北京百度網(wǎng)訊科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010575481.4/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





