[發(fā)明專利]一種方面級用戶產(chǎn)品評論情感分析方法及系統(tǒng)有效
| 申請?zhí)枺?/td> | 202010065377.0 | 申請日: | 2020-01-20 |
| 公開(公告)號: | CN111274398B | 公開(公告)日: | 2022-06-14 |
| 發(fā)明(設(shè)計)人: | 陳羽中;莊天豪;劉漳輝 | 申請(專利權(quán))人: | 福州大學(xué) |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/284;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 福州元創(chuàng)專利商標(biāo)代理有限公司 35100 | 代理人: | 丘鴻超;蔡學(xué)俊 |
| 地址: | 350108 福建省福州市*** | 國省代碼: | 福建;35 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 方面 用戶 產(chǎn)品 評論 情感 分析 方法 系統(tǒng) | ||
1.一種方面級用戶產(chǎn)品評論情感分析方法,其特征在于,包括以下步驟:
步驟A:提取用戶的產(chǎn)品評論、評論涉及的產(chǎn)品方面詞、產(chǎn)品方面詞的位置信息,并對產(chǎn)品方面的情感極性進行標(biāo)注,構(gòu)建訓(xùn)練集SA;
步驟B:使用訓(xùn)練集SA,訓(xùn)練用于方面級用戶產(chǎn)品評論情感分析的融合記憶網(wǎng)絡(luò)與雙向長短期記憶網(wǎng)絡(luò)的深度學(xué)習(xí)網(wǎng)絡(luò)模型M;
步驟C:輸入用戶對產(chǎn)品的評論,提取評論涉及的產(chǎn)品方面詞,將產(chǎn)品評論、產(chǎn)品方面詞輸入到訓(xùn)練好的深度學(xué)習(xí)網(wǎng)絡(luò)模型M中,輸出對產(chǎn)品方面的情感評價極性;
所述步驟B具體包括以下步驟:
步驟B1:對訓(xùn)練集SA中的每條用戶產(chǎn)品評論、評論中的產(chǎn)品方面詞、產(chǎn)品方面詞的位置、產(chǎn)品方面的情感極性進行編碼,得到方面級用戶產(chǎn)品評論的初始表征向量和產(chǎn)品方面向量
步驟B2:將步驟B1得到的初始表征向量輸入到雙向長短期記憶網(wǎng)絡(luò)中,得到方面級用戶產(chǎn)品評論的帶位置信息的記憶向量H;
步驟B3:將步驟B2得到的記憶向量H和步驟B1得到的產(chǎn)品方面向量輸入到記憶網(wǎng)絡(luò)中,使用多頭注意力機制進行情感極性學(xué)習(xí),得到方面級用戶產(chǎn)品評論的表征向量ek,其中k是記憶網(wǎng)絡(luò)中計算層的層數(shù);
步驟B4:連接步驟B2得到的記憶向量H與步驟B3得到的表征向量ek,輸入到張量層進行特征融合,得到方面級用戶產(chǎn)品評論的記憶融合表征向量e(s);
步驟B5:將步驟B4得到的記憶融合表征向量e(s)輸入到softmax層,根據(jù)目標(biāo)損失函數(shù)loss,利用反向傳播方法計算深度學(xué)習(xí)網(wǎng)絡(luò)中各參數(shù)的梯度,并利用隨機梯度下降方法更新參數(shù);
步驟B6:當(dāng)深度學(xué)習(xí)網(wǎng)絡(luò)模型M產(chǎn)生的損失值小于設(shè)定閾值且不再降低或者迭代次數(shù)達到最大迭代次數(shù),則終止深度學(xué)習(xí)網(wǎng)絡(luò)模型的訓(xùn)練。
2.根據(jù)權(quán)利要求1所述的一種方面級用戶產(chǎn)品評論情感分析方法,其特征在于,所述步驟B1具體包括以下步驟:
步驟B11:遍歷訓(xùn)練集SA,SA中的每個訓(xùn)練樣本表示為sa=(s,a,c),其中s表示產(chǎn)品評論,a表示評論s涉及的產(chǎn)品方面,c為該產(chǎn)品方面的評論對應(yīng)的情感極性,情感極性分為三種:積極、消極、中性;對訓(xùn)練樣本sa中的評論s和產(chǎn)品方面a進行分詞處理,去除停用詞;
其中,評論s經(jīng)過分詞及去除停用詞后,表示為:
其中,為評論s經(jīng)過分詞及去除停用詞后剩余詞語中的第i個詞,i=1,2,.....,N,N為評論s經(jīng)過分詞及去除停用詞后剩余的詞語數(shù)量;
步驟B12:對經(jīng)過分詞及去除停用詞后的產(chǎn)品評論s進行編碼,得到評論s的初始表征向量表示為:
其中,為第i個詞所對應(yīng)的詞向量,通過在預(yù)訓(xùn)練的詞向量矩陣E∈Rd×|D|中查找得到,其中d表示詞向量的維度,|D|是詞典D中的詞語數(shù);為評論s中第i個詞所對應(yīng)的位置信息的編碼,其編碼方式如下:
其中,js(a)為經(jīng)過分詞及去除停用詞后的產(chǎn)品方面a中的第一個詞在評論s中的位置,而je(a)為經(jīng)過分詞及去除停用詞后的產(chǎn)品方面a中的最后一個詞在評論s中的位置;
是評論s的初始表征向量中第t個單詞及其位置信息pt的聯(lián)合表示,“;”表示向量連接操作,t=1,2,.....,N,評論s的初始表征向量
步驟B13:對經(jīng)過分詞及去除停用詞后的產(chǎn)品方面a進行編碼,得到產(chǎn)品方面a的表征向量,即產(chǎn)品方面向量
其中,a表示為:
其中,產(chǎn)品方面a是一個短語,由1個或多個連續(xù)的詞構(gòu)成,為產(chǎn)品方面a中的第i個詞,i=1,2,..,m,m為產(chǎn)品方面a經(jīng)過分詞及去除停用詞后剩余的詞語數(shù)量;
用表示第i個詞所對應(yīng)的詞向量,通過在預(yù)訓(xùn)練的詞向量矩陣E∈Rd×|D|中查找得到;
則產(chǎn)品方面a的表征向量表示為:
其中,由對i=1,2,.....,m進行平均池化得到。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于福州大學(xué),未經(jīng)福州大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010065377.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





