[發(fā)明專(zhuān)利]一種面向多類(lèi)別的二次情感分類(lèi)方法有效
| 申請(qǐng)?zhí)枺?/td> | 201910396633.1 | 申請(qǐng)日: | 2019-05-14 |
| 公開(kāi)(公告)號(hào): | CN110175237B | 公開(kāi)(公告)日: | 2023-02-03 |
| 發(fā)明(設(shè)計(jì))人: | 吳雯;紀(jì)雨;班啟敏;賀樑 | 申請(qǐng)(專(zhuān)利權(quán))人: | 華東師范大學(xué) |
| 主分類(lèi)號(hào): | G06F16/35 | 分類(lèi)號(hào): | G06F16/35;G06Q30/0202 |
| 代理公司: | 上海藍(lán)迪專(zhuān)利商標(biāo)事務(wù)所(普通合伙) 31215 | 代理人: | 徐筱梅;張翔 |
| 地址: | 200241 *** | 國(guó)省代碼: | 上海;31 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 面向 類(lèi)別 二次 情感 分類(lèi) 方法 | ||
1.一種面向多類(lèi)別的二次情感分類(lèi)方法,其特征在于,該方法包括以下具體步驟:
步驟1:獲取用戶和物品的交互信息
使用k維向量Lu表示用戶u的興趣信息,使用k維向量Lp表示物品p的屬性信息,其中k的取值范圍在100到300之間;將Lu和Lp點(diǎn)乘得到用戶u和物品p的交互信息Iup;Iup是k維向量,每一維表示用戶u對(duì)物品p的對(duì)應(yīng)屬性的滿意程度;
步驟2:基于用戶的粗分類(lèi)
使用n維向量Cu表示用戶u的類(lèi)別偏好信息,其中n等于類(lèi)別總數(shù);將Iup和Cu送入深度神經(jīng)網(wǎng)絡(luò)得到基于用戶的粗分類(lèi)結(jié)果Ru,具體計(jì)算如下式(1)-(3);Ru是n維向量,每一維表示從用戶角度看,對(duì)用戶u給物品p所寫(xiě)的評(píng)論rup屬于對(duì)應(yīng)類(lèi)別的相對(duì)可能性;
Ru1=Dropout(Relu(Wu1*[Iup;Cu]+bu1)) (1)
Ru2=Dropout(Relu(Wu2*Ru1+bu2)) (2)
Ru=Wu3*Ru2+bu3 (3)
其中,Dropout是正則化手段,Relu(x)=max(0,x)是激活函數(shù),Wu1、Wu2和Wu3是權(quán)重矩陣,bu1、bu2和bu3是偏置項(xiàng),Ru1是深度神經(jīng)網(wǎng)絡(luò)第一層的輸出,Ru2是深度神經(jīng)網(wǎng)絡(luò)第二層的輸出;步驟3:基于物品的粗分類(lèi)
使用n維向量Cp表示物品p的類(lèi)別偏好信息,其中n等于類(lèi)別總數(shù);將Iup和Cp送入深度神經(jīng)網(wǎng)絡(luò)得到基于物品的粗分類(lèi)結(jié)果Rp,具體計(jì)算如下式(4)-(6);Rp是n維向量,每一維表示從物品角度看,對(duì)用戶u給物品p所寫(xiě)的評(píng)論rup屬于對(duì)應(yīng)類(lèi)別的相對(duì)可能性;
Rp1=Dropout(Relu(Wp1*[Iup;Cp]+bp1)) (4)
Rp2=Dropout(Relu(Wp2*Rp1+bp2)) (5)
Rp=Wp3*Rp2+bp3 (6)
其中,Dropout是正則化手段,Relu(x)=max(0,x)是激活函數(shù),Wp1、Wp2和Wp3是權(quán)重矩陣,bp1、bp2和bp3是偏置項(xiàng),Rp1是深度神經(jīng)網(wǎng)絡(luò)第一層的輸出,Rp2是深度神經(jīng)網(wǎng)絡(luò)第二層的輸出;
步驟4:評(píng)論數(shù)據(jù)預(yù)處理
利用word2vec將評(píng)論rup中的詞進(jìn)行向量化,每一個(gè)詞用g維向量表示,其中g(shù)的取值范圍在100到200之間;
步驟5:詞級(jí)別信息提取
將評(píng)論rup進(jìn)行分句,對(duì)每個(gè)句子進(jìn)行如下處理:將句子中的詞所對(duì)應(yīng)的向量按序送入雙向LSTM中,使用雙向LSTM對(duì)應(yīng)位置的輸出表示該位置的詞所包含的信息;
步驟6:句子表征生成
使用z維向量Qu表示用戶u的用詞偏好信息,使用z維向量Qp表示物品p的受詞偏好信息,其中z的取值范圍在100到300之間;使用用戶和物品的交互信息Iup、用戶粗分類(lèi)結(jié)果Ru、用戶用詞偏好信息Qu、用戶類(lèi)別偏好信息Cu、物品粗分類(lèi)結(jié)果Rp、物品受詞偏好信息Qp及物品類(lèi)別偏好信息Cp作為注意力機(jī)制,對(duì)每一個(gè)句子中的詞賦予不同的權(quán)重,最終對(duì)每一個(gè)句子中的所有詞信息進(jìn)行加權(quán)求和,得到的結(jié)果用來(lái)表征對(duì)應(yīng)的句子,具體公式如下式(7)-(10):
Aup=[Iup;Ru;Qu;Cu;Rp;Qp;Cp] (10)
其中Si表示評(píng)論rup的第i個(gè)句子,li表示第i個(gè)句子的長(zhǎng)度,hij用來(lái)表示評(píng)論rup中的第i個(gè)句子中的第j個(gè)詞所包含的信息,表示第i個(gè)句子中的第j個(gè)詞的權(quán)重,Aup表示注意力向量,e是權(quán)重計(jì)算函數(shù),Wh和Wa是權(quán)重句子,v是權(quán)重向量,vT表示v的轉(zhuǎn)置;
步驟7:句子級(jí)別信息提取
將評(píng)論rup中的每一句話的表征按序送入雙向LSTM中,使用雙向LSTM對(duì)應(yīng)位置的輸出表示該位置的句子所包含的信息;
步驟8:評(píng)論表征生成
使用用戶和物品的交互信息Iup、用戶粗分類(lèi)結(jié)果Ru、用戶用詞偏好信息Qu、用戶類(lèi)別偏好信息Cu、物品粗分類(lèi)結(jié)果Rp、物品受詞偏好信息Qp、物品類(lèi)別偏好信息Cp作為注意力機(jī)制,對(duì)評(píng)論rup中的每一個(gè)句子賦予不同的權(quán)重,最終對(duì)評(píng)論rup中的所有句子的表征進(jìn)行加權(quán)求和,得到的結(jié)果d用來(lái)表征評(píng)論;
步驟9:細(xì)分類(lèi)
使用評(píng)論表征生成細(xì)分類(lèi)結(jié)果Fup;Fup是n維向量,每一維表示從評(píng)論信息看,評(píng)論rup屬于對(duì)應(yīng)類(lèi)別的相對(duì)可能性,其中n等于類(lèi)別總數(shù);具體公式如下式(11):
Fup=Wmd+bm (11)
其中Wm是權(quán)重矩陣,bm是偏置項(xiàng),d是評(píng)論結(jié)果;
步驟10:預(yù)測(cè)
將用戶粗分類(lèi)結(jié)果Ru、物品粗分類(lèi)結(jié)果Rp和細(xì)分類(lèi)結(jié)果Fup相加得到最終結(jié)果Final,公式如下式(12);Final是n為向量,每一維表示評(píng)論rup屬于對(duì)應(yīng)類(lèi)別的相對(duì)可能性,其中n等于類(lèi)別總數(shù);取相對(duì)可能性最大的類(lèi)別作為最終預(yù)測(cè)類(lèi)別;
Final=Ru+Rp+Fup (12)。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于華東師范大學(xué),未經(jīng)華東師范大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910396633.1/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 類(lèi)別生成程序、類(lèi)別生成裝置以及類(lèi)別生成方法
- 顧客類(lèi)別分析裝置、顧客類(lèi)別分析系統(tǒng)以及顧客類(lèi)別分析方法
- 顧客類(lèi)別分析裝置、顧客類(lèi)別分析系統(tǒng)以及顧客類(lèi)別分析方法
- 語(yǔ)義類(lèi)別分類(lèi)
- 類(lèi)別管理
- 圖像解析裝置及圖像解析方法
- 類(lèi)別的編碼方法及裝置
- 電子書(shū)頁(yè)面展示方法、計(jì)算設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 交易控制方法及裝置
- 一種圖像搜索方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)





