[發(fā)明專利]文本的情感傾向性分析方法、裝置、設(shè)備及介質(zhì)在審
| 申請?zhí)枺?/td> | 202210433270.6 | 申請日: | 2022-04-24 |
| 公開(公告)號: | CN114691836A | 公開(公告)日: | 2022-07-01 |
| 發(fā)明(設(shè)計)人: | 金力;李曉宇;張澤群;劉慶;張林浩;李樹超 | 申請(專利權(quán))人: | 中國科學(xué)院空天信息創(chuàng)新研究院 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/35;G06F40/289;G06F40/30;G06N3/04;G06N3/08 |
| 代理公司: | 中科專利商標(biāo)代理有限責(zé)任公司 11021 | 代理人: | 樊曉 |
| 地址: | 100190 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 文本 情感 傾向性 分析 方法 裝置 設(shè)備 介質(zhì) | ||
1.一種文本的情感傾向性分析方法,包括:
從待分析文本中分別提取語義特征、詞性特征以及共現(xiàn)詞特征,其中,所述待分析文本包括文本內(nèi)容和與所述文本內(nèi)容相關(guān)聯(lián)的評論內(nèi)容;
將所述語義特征、所述詞性特征以及所述共現(xiàn)詞特征拼接,得到拼接特征;
對所述拼接特征進(jìn)行預(yù)處理,得到所述待分析文本中的詞序列特征;
對所述待分析文本中的詞序列特征進(jìn)行聚合,得到所述待分析文本的句子向量;以及
將所述句子向量輸入情感傾向性分析模型,輸出所述待分析文本的情感傾向性分析結(jié)果。
2.根據(jù)權(quán)利要求1中所述的方法,其中,所述對所述拼接特征進(jìn)行預(yù)處理,得到所述待分析文本中的詞序列特征包括:
對所述拼接特征進(jìn)行線性激活轉(zhuǎn)換,生成線性激活的特征;
對所述拼接特征進(jìn)行非線性激活轉(zhuǎn)換,生成非線性激活的特征;
基于所述拼接特征,利用注意力機(jī)制得到權(quán)重向量;
根據(jù)所述權(quán)重向量,對所述線性激活的特征和所述非線性激活的特征進(jìn)行組合,得到所述待分析文本中的詞序列特征。
3.根據(jù)權(quán)利要求2中所述的方法,其中,所述基于所述拼接特征,利用注意力機(jī)制得到權(quán)重向量包括:
根據(jù)不同映射矩陣,將所述拼接特征轉(zhuǎn)換為查詢向量、鍵向量以及值向量;
利用所述注意力機(jī)制,獲得具有不同權(quán)重值的拼接特征;
將所述具有不同權(quán)重值的拼接特征通過前向傳播層進(jìn)行降維,得到降維后的具有不同權(quán)重值的拼接特征;
將所述降維后的具有不同權(quán)重值的拼接特征通過非線性激活函數(shù)生成所述權(quán)重向量。
4.根據(jù)權(quán)利要求1中所述的方法,其中,所述對所述待分析文本中的詞序列特征進(jìn)行聚合,得到所述待分析文本的句子向量包括:
將所述待分析文本中的詞序列特征輸入門控循環(huán)單元;
輸出所述待分析文本的句子向量。
5.根據(jù)權(quán)利要求1中所述的方法,其中,所述從待分析文本中分別提取語義特征、詞性特征以及共現(xiàn)詞特征包括:
將所述待分析文本輸入預(yù)訓(xùn)練語言表征模型,輸出所述語義特征;
對所述文本內(nèi)容和所述評論內(nèi)容中共同出現(xiàn)的詞進(jìn)行嵌入表示,得到所述共現(xiàn)詞特征;
將所述待分析文本中每個詞的詞性進(jìn)行嵌入表示,得到所述詞性特征。
6.根據(jù)權(quán)利要求1中所述的方法,其中,所述情感傾向性分析模型通過預(yù)先訓(xùn)練得到;所述預(yù)先訓(xùn)練的方法包括:
從訓(xùn)練樣本中分別提取樣本語義特征、樣本詞性特征以及樣本共現(xiàn)詞特征,其中,所述訓(xùn)練樣本包括:文本內(nèi)容樣本、與所述文本內(nèi)容樣本相關(guān)聯(lián)的評論內(nèi)容樣本以及情感標(biāo)簽;
將所述樣本語義特征、所述樣本詞性特征以及所述樣本共現(xiàn)詞特征拼接,得到樣本拼接特征;
對所述樣本拼接特征進(jìn)行預(yù)處理,得到所述訓(xùn)練樣本中的樣本詞序列特征;
對所述訓(xùn)練樣本中的樣本詞序列特征進(jìn)行聚合,得到所述訓(xùn)練樣本的樣本句子向量;
將所述樣本句子向量輸入分類模型,輸出所述訓(xùn)練樣本的情感傾向性分類結(jié)果;
基于所述情感傾向性分類結(jié)果和所述情感標(biāo)簽,調(diào)整所述分類模型的參數(shù),將訓(xùn)練后的分類模型作為所述情感傾向性分析模型。
7.一種文本的情感傾向性分析裝置,包括:
特征提取模塊,用于從待分析文本中分別提取語義特征、詞性特征以及共現(xiàn)詞特征,其中,所述待分析文本包括文本內(nèi)容和與所述文本內(nèi)容相關(guān)聯(lián)的評論內(nèi)容;
特征拼接模塊,用于將所述語義特征、所述詞性特征以及所述共現(xiàn)詞特征拼接,得到拼接特征;
預(yù)處理模塊,用于對所述拼接特征進(jìn)行預(yù)處理,得到所述待分析文本中的詞序列特征;
聚合模塊,用于對所述待分析文本中的詞序列特征進(jìn)行聚合,得到所述待分析文本的句子向量;以及
分析模塊,用于將所述句子向量輸入情感傾向性分析模型,輸出所述待分析文本的情感傾向性分析結(jié)果。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國科學(xué)院空天信息創(chuàng)新研究院,未經(jīng)中國科學(xué)院空天信息創(chuàng)新研究院許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210433270.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 文本匹配方法及裝置
- 互聯(lián)網(wǎng)金融非顯性廣告識別方法及裝置
- 文本結(jié)論智能推薦方法、裝置及計算機(jī)可讀存儲介質(zhì)
- 文本檢索方法、裝置及設(shè)備、文本檢索模型的訓(xùn)練方法
- 基于級連模式的文本匹配方法及裝置
- 一種文本關(guān)系提取方法、裝置及電子設(shè)備
- 文本的標(biāo)準(zhǔn)化處理方法、裝置、電子設(shè)備及計算機(jī)介質(zhì)
- 文本標(biāo)簽確定方法、裝置、計算機(jī)設(shè)備和存儲介質(zhì)
- 文本圖像合成方法、裝置、設(shè)備及存儲介質(zhì)
- 文本生成方法、裝置和電子設(shè)備





