[發(fā)明專利]一種基于用戶評論的情感傾向分類方法、裝置及存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 201810572043.5 | 申請日: | 2018-06-05 |
| 公開(公告)號: | CN110569495A | 公開(公告)日: | 2019-12-13 |
| 發(fā)明(設(shè)計)人: | 馮博琳;薛迎梅;劉斌生;王秋森;吳中恒 | 申請(專利權(quán))人: | 北京四維圖新科技股份有限公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06Q30/02 |
| 代理公司: | 11532 北京市天璽沐澤專利代理事務(wù)所(普通合伙) | 代理人: | 謝鑫 |
| 地址: | 100028 北京市海淀*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語義特征 情感傾向 詞向量 卷積神經(jīng)網(wǎng)絡(luò) 循環(huán)單元 用戶評論 雙向門 特征圖 拼接 預(yù)處理 矩陣 語義 詞袋模型 存儲介質(zhì) 分類結(jié)果 評論數(shù)據(jù) 人工標(biāo)注 商家顯示 分類 維度 語句 申請 標(biāo)注 費力 | ||
本申請公開了一種基于用戶評論的情感傾向分類方法、裝置及存儲介質(zhì),該方法包括:對用戶評論語句進(jìn)行預(yù)處理,得到詞項;獲取詞向量矩陣;根據(jù)雙向門控循環(huán)單元獲取每個詞項的上文語義特征和下文語義特征,并將上文語義特征、下文語義特征和詞項的詞向量拼接;利用卷積神經(jīng)網(wǎng)絡(luò)對拼接后的詞向量提取出固定維度的特征圖;根據(jù)上述特征圖對情感傾向進(jìn)行分類;根據(jù)分類結(jié)果將商家顯示在地圖上。本申請能夠取得的有益效果在于,結(jié)合雙向門控循環(huán)單元和卷積神經(jīng)網(wǎng)絡(luò)解決了在基于規(guī)則的方法中需要人工總結(jié)大量規(guī)則及詞典的問題及基于詞袋模型導(dǎo)致語義、詞序丟失的問題;根據(jù)情感傾向的類別對大規(guī)模評論數(shù)據(jù)進(jìn)行標(biāo)注,解決了人工標(biāo)注費時費力的問題。
技術(shù)領(lǐng)域
本申請涉及自然語言處理技術(shù)領(lǐng)域,尤其是涉及一種基于用戶評論的情感傾向分類方法、裝置及存儲介質(zhì)。
背景技術(shù)
目前根據(jù)用戶對商家的評論分析用戶的情感,以此發(fā)現(xiàn)優(yōu)質(zhì)商家,并將優(yōu)質(zhì)商家更新到地圖中。用戶情感分析通常通過基于規(guī)則的方法和基于機(jī)器學(xué)習(xí)的分類方法實現(xiàn)。基于規(guī)則的方法通常需要依靠大量語料資源,比如詞典及人為總結(jié)的相應(yīng)規(guī)則,通過詞典及規(guī)則對文檔中相應(yīng)詞項進(jìn)行規(guī)則匹配,得出文本情感傾向。這種方法需要根據(jù)人工經(jīng)驗總結(jié)大量規(guī)則,在實際使用中其性能會受到分詞、詞性標(biāo)注及句法分析工具輸出結(jié)果的較大影響。由于語義表達(dá)的靈活性,規(guī)則難以覆蓋全面,大量語義表達(dá)難以用規(guī)則描述。當(dāng)規(guī)則數(shù)量增多時,多個規(guī)則之間的優(yōu)先級難以調(diào)整。基于機(jī)器學(xué)習(xí)的分類方法利用有標(biāo)注的數(shù)據(jù)資源訓(xùn)練分類模型,得到文本情感類別。較早的通過詞袋模型,增加一系列特征選擇及權(quán)重計算方法用于提取文中關(guān)鍵特征并進(jìn)行加權(quán),獲得文檔的表示,之后訓(xùn)練分類器實現(xiàn)分類。這種方法通常需要大量標(biāo)注數(shù)據(jù)用于訓(xùn)練。
由于現(xiàn)有的用戶評分僅通過用戶對商家的評分來區(qū)分當(dāng)前商家是否為優(yōu)質(zhì)商家,因此存在普遍偏高的問題,不夠準(zhǔn)確。
發(fā)明內(nèi)容
本申請實施例提供一種基于用戶評論的情感傾向分類方法、裝置及存儲設(shè)備。解決了需要人工總結(jié)大量規(guī)則及詞典且會受到底層分析工具出錯影響的問題;解決了基于詞袋模型導(dǎo)致語義、詞序丟失的問題;解決人工標(biāo)注費時費力等問題。
本申請?zhí)峁┝艘环N基于用戶評論的情感傾向分類方法,該方法包括:
對用戶評論語句進(jìn)行預(yù)處理,得到至少一個詞項;其中,所述用戶評論語句為用戶對商家的用戶評論語句;
根據(jù)所述至少一個詞項獲取所述用戶評論語句對應(yīng)的詞向量矩陣,所述詞向量矩陣的每行為一個詞項的詞向量,每列為所述詞向量的一個維度;
針對所述至少一個詞項中的每個詞項,根據(jù)雙向門控循環(huán)單元分別獲取所述每個詞項的上文語義特征和下文語義特征,并將所述每個詞項的上文語義特征、所述下文語義特征和所述每個詞項的詞向量進(jìn)行拼接;
通過卷積神經(jīng)網(wǎng)絡(luò)對拼接后的詞向量進(jìn)行處理,提取出固定維度的特征圖;其中,所述固定維度的特征圖具有所述用戶評論語句所屬的情感傾向特征;
根據(jù)所述固定維度的特征圖具有的所述用戶評論語句所屬的情感傾向特征對情感傾向進(jìn)行分類;其中,所述情感傾向的類別為好評或者差評;
根據(jù)對情感傾向進(jìn)行分類的結(jié)果將所述用戶評論語句所指向的商家顯示在地圖上。
本申請還提供了一種基于用戶評論的情感傾向分類裝置,該裝置包括:預(yù)處理模塊、獲取詞向量矩陣模塊、獲取上下文語義特征模塊、卷積神經(jīng)網(wǎng)絡(luò)模塊、分類模塊和顯示商家模塊;
所述預(yù)處理模塊,用于對用戶評論語句進(jìn)行預(yù)處理,得到至少一個詞項;其中,所述用戶評論語句為用戶對商家的用戶評論語句;
所述獲取詞向量矩陣模塊,用于根據(jù)所述至少一個詞項獲取所述用戶評論語句對應(yīng)的詞向量矩陣,所述詞向量矩陣的每行為一個詞項的詞向量,每列為所述詞向量的一個維度;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京四維圖新科技股份有限公司,未經(jīng)北京四維圖新科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810572043.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種基于肺結(jié)節(jié)CT圖像的語義特征自動打分方法及系統(tǒng)
- 一種基于深度學(xué)習(xí)的文本語義特征生成優(yōu)化方法
- 語義空間地圖構(gòu)建方法及裝置
- 帶有語義特征得分的肺結(jié)節(jié)檢測方法和系統(tǒng)
- 三維模型生成方法、裝置、計算機(jī)設(shè)備及存儲介質(zhì)
- 一種圖像識別方法、裝置、設(shè)備及存儲介質(zhì)
- 舌體圖片分類方法、裝置、計算機(jī)設(shè)備及存儲介質(zhì)
- 融合深度特征和時序模型的語義情感分析方法
- 一種圖像語義分割方法、裝置及存儲介質(zhì)
- 一種對圖像進(jìn)行語義分割的方法及系統(tǒng)
- 終端卷積神經(jīng)網(wǎng)絡(luò)的處理方法、裝置、存儲介質(zhì)及處理器
- 一種基于卷積神經(jīng)網(wǎng)絡(luò)的圖像深度估計方法
- 卷積神經(jīng)網(wǎng)絡(luò)的生成方法及裝置
- 一種卷積神經(jīng)網(wǎng)絡(luò)硬件模塊部署方法
- 卷積神經(jīng)網(wǎng)絡(luò)的處理方法、裝置、設(shè)備及存儲介質(zhì)
- 一種卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法及裝置
- 一種基于通道數(shù)搜索卷積神經(jīng)網(wǎng)絡(luò)的方法
- 卷積神經(jīng)網(wǎng)絡(luò)處理方法、裝置和電子系統(tǒng)
- 一種基于空洞卷積循環(huán)神經(jīng)網(wǎng)絡(luò)的聲音事件檢測方法
- 基于稀疏卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測方法及檢測裝置





