[發(fā)明專利]文本信息的情感分析方法和系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 201711183201.X | 申請(qǐng)日: | 2017-11-23 |
| 公開(公告)號(hào): | CN107967258B | 公開(公告)日: | 2021-09-17 |
| 發(fā)明(設(shè)計(jì))人: | 張毅;黃宇 | 申請(qǐng)(專利權(quán))人: | 廣州艾媒數(shù)聚信息咨詢股份有限公司 |
| 主分類號(hào): | G06F40/211 | 分類號(hào): | G06F40/211;G06F40/284 |
| 代理公司: | 廣州華進(jìn)聯(lián)合專利商標(biāo)代理有限公司 44224 | 代理人: | 黃隸凡 |
| 地址: | 510006 廣東省廣州*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 文本 信息 情感 分析 方法 系統(tǒng) | ||
1.一種文本信息的情感分析方法,其特征在于,包括以下步驟:
從文本信息中提取關(guān)鍵詞和所述關(guān)鍵詞的上下文關(guān)聯(lián)詞;
根據(jù)預(yù)置的詞向量分析模型對(duì)所述關(guān)鍵詞和所述上下文關(guān)聯(lián)詞進(jìn)行分析,獲取所述關(guān)鍵詞的第一詞向量;
根據(jù)所述第一詞向量和第二詞向量獲取所述文本信息的情感值,其中,所述第二詞向量是預(yù)存的情感詞的詞向量;
所述根據(jù)預(yù)置的詞向量分析模型對(duì)所述關(guān)鍵詞和所述上下文關(guān)聯(lián)詞進(jìn)行分析的步驟之前還包括以下步驟:
建立二元神經(jīng)網(wǎng)絡(luò)模型,獲取待訓(xùn)練的信息語(yǔ)料,將所述信息語(yǔ)料作為訓(xùn)練樣本對(duì)所述二元神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,獲得所述預(yù)置的詞向量分析模型;
所述將所述信息語(yǔ)料作為訓(xùn)練樣本對(duì)所述二元神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練的步驟包括以下步驟:
從所述信息語(yǔ)料中選取目標(biāo)詞和相關(guān)詞,初始化所述目標(biāo)詞和所述相關(guān)詞的原始詞向量,通過(guò)所述二元神經(jīng)網(wǎng)絡(luò)模型對(duì)所述相關(guān)詞的原始詞向量進(jìn)行分析,獲取所述目標(biāo)詞的原始詞向量的誤差向量,根據(jù)所述目標(biāo)詞的原始詞向量的誤差向量對(duì)所述目標(biāo)詞的原始詞向量進(jìn)行修正;
所述相關(guān)詞為多個(gè),所述通過(guò)所述二元神經(jīng)網(wǎng)絡(luò)模型對(duì)所述相關(guān)詞的原始詞向量進(jìn)行分析的步驟包括以下步驟:
將各所述相關(guān)詞的原始詞向量相加,獲得和向量;
將所述目標(biāo)詞和各所述相關(guān)詞作為葉節(jié)點(diǎn)構(gòu)建所述二元神經(jīng)網(wǎng)絡(luò)模型的哈夫曼樹,獲取所述哈夫曼樹的根節(jié)點(diǎn)至所述目標(biāo)詞對(duì)應(yīng)的葉節(jié)點(diǎn)的路徑,根據(jù)所述和向量和所述路徑中的中間節(jié)點(diǎn)的向量對(duì)相應(yīng)的中間節(jié)點(diǎn)進(jìn)行Logistic分類;
若當(dāng)前中間節(jié)點(diǎn)的分類結(jié)果與所述路徑的走向不同,則根據(jù)所述路徑的走向?qū)Ξ?dāng)前中間節(jié)點(diǎn)的向量進(jìn)行修正,并獲取當(dāng)前中間節(jié)點(diǎn)的誤差向量;
將所有的中間節(jié)點(diǎn)的誤差向量相加作為所述目標(biāo)詞的原始詞向量的誤差向量。
2.根據(jù)權(quán)利要求1所述的文本信息的情感分析方法,其特征在于,所述獲取待訓(xùn)練的信息語(yǔ)料的步驟包括以下步驟:
獲取網(wǎng)絡(luò)數(shù)據(jù)文本,對(duì)所述網(wǎng)絡(luò)數(shù)據(jù)文本進(jìn)行噪音信息過(guò)濾,并切詞生成所述待訓(xùn)練的信息語(yǔ)料。
3.根據(jù)權(quán)利要求1所述的文本信息的情感分析方法,其特征在于,還包括以下步驟:
根據(jù)所述預(yù)置的詞向量分析模型對(duì)所述情感詞進(jìn)行分析,獲取所述第二詞向量并進(jìn)行存儲(chǔ)。
4.根據(jù)權(quán)利要求1至3中任意一項(xiàng)所述的文本信息的情感分析方法,其特征在于,所述根據(jù)所述第一詞向量和第二詞向量獲取所述文本信息的情感值的步驟包括以下步驟:
根據(jù)所述第一詞向量和不同情感詞的第二詞向量分別獲取所述文本信息對(duì)應(yīng)不同情感詞的相對(duì)值,將最大的相對(duì)值作為所述文本信息的情感值。
5.一種文本信息的情感分析系統(tǒng),其特征在于,包括:
詞語(yǔ)獲取單元,用于從文本信息中提取關(guān)鍵詞和所述關(guān)鍵詞的上下文關(guān)聯(lián)詞;
詞向量分析單元,用于根據(jù)預(yù)置的詞向量分析模型對(duì)所述關(guān)鍵詞和所述上下文關(guān)聯(lián)詞進(jìn)行分析,獲取所述關(guān)鍵詞的第一詞向量;
情感值獲取單元,用于根據(jù)所述第一詞向量和第二詞向量獲取所述文本信息的情感值,其中,所述第二詞向量是預(yù)存的情感詞的詞向量;
模型建立單元,用于建立二元神經(jīng)網(wǎng)絡(luò)模型,獲取待訓(xùn)練的信息語(yǔ)料,將所述信息語(yǔ)料作為訓(xùn)練樣本對(duì)所述二元神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,獲得所述預(yù)置的詞向量分析模型;
所述模型建立單元還用于從所述信息語(yǔ)料中選取目標(biāo)詞和相關(guān)詞,初始化所述目標(biāo)詞和所述相關(guān)詞的原始詞向量,通過(guò)所述二元神經(jīng)網(wǎng)絡(luò)模型對(duì)所述相關(guān)詞的原始詞向量進(jìn)行分析,獲取所述目標(biāo)詞的原始詞向量的誤差向量,根據(jù)所述目標(biāo)詞的原始詞向量的誤差向量對(duì)所述目標(biāo)詞的原始詞向量進(jìn)行修正;
所述相關(guān)詞為多個(gè),所述模型建立單元還用于將各所述相關(guān)詞的原始詞向量相加,獲得和向量;將所述目標(biāo)詞和各所述相關(guān)詞作為葉節(jié)點(diǎn)構(gòu)建所述二元神經(jīng)網(wǎng)絡(luò)模型的哈夫曼樹,獲取所述哈夫曼樹的根節(jié)點(diǎn)至所述目標(biāo)詞對(duì)應(yīng)的葉節(jié)點(diǎn)的路徑,根據(jù)所述和向量和所述路徑中的中間節(jié)點(diǎn)的向量對(duì)相應(yīng)的中間節(jié)點(diǎn)進(jìn)行Logistic分類;若當(dāng)前中間節(jié)點(diǎn)的分類結(jié)果與所述路徑的走向不同,則根據(jù)所述路徑的走向?qū)Ξ?dāng)前中間節(jié)點(diǎn)的向量進(jìn)行修正,并獲取當(dāng)前中間節(jié)點(diǎn)的誤差向量;將所有的中間節(jié)點(diǎn)的誤差向量相加作為所述目標(biāo)詞的原始詞向量的誤差向量。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣州艾媒數(shù)聚信息咨詢股份有限公司,未經(jīng)廣州艾媒數(shù)聚信息咨詢股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711183201.X/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 文本匹配方法及裝置
- 互聯(lián)網(wǎng)金融非顯性廣告識(shí)別方法及裝置
- 文本結(jié)論智能推薦方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 文本檢索方法、裝置及設(shè)備、文本檢索模型的訓(xùn)練方法
- 基于級(jí)連模式的文本匹配方法及裝置
- 一種文本關(guān)系提取方法、裝置及電子設(shè)備
- 文本的標(biāo)準(zhǔn)化處理方法、裝置、電子設(shè)備及計(jì)算機(jī)介質(zhì)
- 文本標(biāo)簽確定方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 文本圖像合成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 文本生成方法、裝置和電子設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





