[發(fā)明專利]面向細(xì)粒度情感的可解釋推薦模型有效
| 申請?zhí)枺?/td> | 201910333302.3 | 申請日: | 2019-04-24 |
| 公開(公告)號: | CN110083684B | 公開(公告)日: | 2021-11-19 |
| 發(fā)明(設(shè)計)人: | 王英;孫玉東;王鑫;李暢;于尤婧;孫小婉;凌云志;馬涪元 | 申請(專利權(quán))人: | 吉林大學(xué) |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/335;G06F16/36;G06Q30/02 |
| 代理公司: | 長春市恒譽專利代理事務(wù)所(普通合伙) 22212 | 代理人: | 李榮武 |
| 地址: | 130012 吉*** | 國省代碼: | 吉林;22 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 面向 細(xì)粒度 情感 可解釋 推薦 模型 | ||
1.一種面向細(xì)粒度情感的可解釋推薦模型,其特征在于:
(1)由互信息矩陣構(gòu)建模塊實現(xiàn)多信息的高效融合:
1)針對某一特定推薦環(huán)境,對任何由用戶為實體打分同時產(chǎn)生評論文本的數(shù)據(jù)進行抽取、過濾等預(yù)處理;
2)對評論文本進行解析,抽取用戶對實體的細(xì)粒度情感信息,構(gòu)建(k,w,s)ij三元組;
其中:(k,w,s)ij表示用戶i對實體j的細(xì)粒度情感的三元組,k表示實體j的特定方面,w表示用戶i針對該特定方面的描述性詞語,s表示該描述性詞語的情感極性標(biāo)簽;
3)構(gòu)建用戶-實體評分矩陣R;
①根據(jù)數(shù)據(jù)集D中的評分構(gòu)建稀疏的用戶-實體評分矩陣
其中:m表示用戶數(shù)量,n表示實體數(shù)量,Rij=rij表示第i個用戶對第j個實體的評分值,不存在評分時Rij=0;
4)篩選具有實際意義的實體-屬性對;
①對于用戶在對實體的評論文本中出現(xiàn)的屬性,定義為該實體擁有的實際屬性,對于其他在該實體中未曾被用戶提及的屬性不參與矩陣的構(gòu)建和計算;
5)構(gòu)建用戶-實體屬性情感矩陣S;
①利用從用戶i的全部評論抽取的多個三元組(k,w,s)ij,定義sijkw;其中:sijkw表示用戶i對實體j的屬性k所使用的描述詞w的情感,根據(jù)描述詞的情感極性其值為+1或-1;
②由1)中的定義計算用戶i對實體j的屬性k的總體情感Q表示從數(shù)據(jù)集中提取的全部的描述詞數(shù)量,重復(fù)的描述詞僅計數(shù)一次;
③最終構(gòu)建用戶-實體屬性情感矩陣S如下:
其中:N為常量,取值一般為評分區(qū)間的最大值;對每一個經(jīng)上述公式進行平滑處理后即得到用戶-實體屬性情感矩陣S,后續(xù)計算中以Si(jk)表示用戶i存在對實體j-屬性k的情感值,S中的每一列表示篩選后的實體-屬性,共p'列,且由(1)-4)中篩選的具有實際意義的實體-屬性數(shù)量通常遠(yuǎn)小于全部實體和全部屬性的兩兩組合數(shù)量,即在大部分?jǐn)?shù)據(jù)集中p'<<n*p,p表示數(shù)據(jù)集中出現(xiàn)的所有屬性的數(shù)量;
6)構(gòu)建實體屬性-描述詞詞頻矩陣O;
①利用從實體j的全部評論抽取的多個三元組(k,w,s)ij,得到實體j的屬性k被描述詞w描述的次數(shù)為nw;
②定義描述實體屬性的描述詞詞頻矩陣如下:
其中:(j,k,w,nw)表示評論數(shù)據(jù)dij中實體j的屬性k被描述詞w描述的次數(shù)為nw,Set為(j,k,w,nw)構(gòu)成的集合,β、δ均為經(jīng)驗參數(shù),exp()表示自然數(shù)為底數(shù)的冪次運算;
(2)由聯(lián)合分解模塊初始化因子矩陣進行多矩陣的約束優(yōu)化求解:
1)初始化用戶、實體、屬性、描述詞隱式因子矩陣;
①構(gòu)建用戶隱式特征矩陣其中m為用戶數(shù)量,a為用戶隱式特征向量維度;
②構(gòu)建實體的隱式特征矩陣其中n為實體數(shù)量,b為用戶隱式特征向量維度;
③構(gòu)建屬性的隱式特征矩陣其中p為不重復(fù)屬性數(shù)量,c為用戶隱式特征向量維度;
④構(gòu)建描述詞的隱式特征矩陣其中q為不重復(fù)描述詞數(shù)量,d為用戶隱式特征向量維度;
2)構(gòu)建共享因子矩陣A,A',分別用以分解R,S和S,O;
①定義實體與評分相關(guān)的潛在固有屬性所對應(yīng)的隱式特征向量f*,其特征維度為c,所有實體中均有該屬性不同于實體的獨特屬性;
②構(gòu)建隱式因子矩陣A由隱式特征矩陣I和f*兩部分構(gòu)成,A中每一行為I的每一行和向量f*的增廣拼接得到A∈Rn*(b+c);
③構(gòu)建隱式因子矩陣A'由產(chǎn)品隱式特征矩陣I和屬性隱式特征矩陣F兩部分組成,A′(jk)表示A'中一行,為產(chǎn)品特征向量Ij與屬性特征向量Fk的增廣拼接;
3)計算用戶、實體、屬性、描述詞隱式因子矩陣;
①通過最小化評分矩陣R中真實評分與隱式特征矩陣相乘重構(gòu)評分的平方差得到最優(yōu)參數(shù)U,I,f*,公式如下:
其中各符號如上述;
②通過最小化用戶-實體屬性情感矩陣S中由數(shù)據(jù)得到的情感值與隱式特征矩陣相乘重構(gòu)情感值的平方差得到最優(yōu)參數(shù)U,I,F,公式如下:
其中各符號如上述;
③通過最小化實體屬性-描述詞詞頻矩陣O中由數(shù)據(jù)得到的真實詞頻與隱式特征矩陣相乘重構(gòu)情感值的平方差得到最優(yōu)參數(shù)I,F,W,公式如下:
其中各符號如上述;
④以上1)2)3)步驟同時進行計算,使用共同的隱式特征矩陣進行優(yōu)化計算,采用自適應(yīng)的小批量梯度下降方法優(yōu)化以上公式,能夠在一定程度上避免陷入局部最優(yōu),自適應(yīng)方法能夠隨迭代次數(shù)動態(tài)更新步長;
(3)由推薦及預(yù)測模塊實現(xiàn)信息的高效重構(gòu)進而生成最終的推薦結(jié)果以及解釋信息:
1)計算用戶對目標(biāo)實體的預(yù)測評分;
①Rij表示目標(biāo)用戶i對實體j的預(yù)測評分,通過用戶隱式特征向量Ui以及隱式因子Aj相乘得到該預(yù)測評分即Rij=Ui*Aj;
2)計算用戶對目標(biāo)實體屬性的預(yù)測情感值;
①Si(j,k)表示目標(biāo)用戶i對實體j的屬性k的預(yù)測情感值,通過用戶隱式特征向量Ui以及共享隱式因子A′(j,k)相乘得到該預(yù)測情感值,即Si(j,k)=Ui*A′(j,k)
3)計算目標(biāo)實體被目標(biāo)描述詞描述的預(yù)測頻率;
①Ow(j,k)表示目標(biāo)實體j的屬性k被目標(biāo)描述詞w描述的預(yù)測頻率,通過描述詞隱式特征向量Ww以及共享隱式因子A′(j,k)相乘得到該預(yù)測情感值,即Ow(j,k)=Ww*A′(j,k)
4)依據(jù)1)所得到的預(yù)測評分給出對目標(biāo)用戶的推薦結(jié)果,依據(jù)2)3)預(yù)測用戶實體屬性的情感以及實體被描述詞描述的預(yù)測頻率給出該推薦結(jié)果的解釋。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于吉林大學(xué),未經(jīng)吉林大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910333302.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種管理和傳送細(xì)粒度業(yè)務(wù)的方法
- 基于CPU硬件性能監(jiān)控計數(shù)器的CPI精確測量方法
- 一種基于改進YOLOv3的細(xì)粒度圖像分類方法
- 細(xì)粒度對象流量分析方法和裝置
- 一種基于點云數(shù)據(jù)建模的方法、裝置和電子設(shè)備
- 細(xì)粒度圖像分類方法、系統(tǒng)、計算機設(shè)備及存儲介質(zhì)
- 基于圖像卷積特征的復(fù)雜背景下害蟲細(xì)粒度圖像識別方法
- 一種細(xì)粒度分類模型的優(yōu)化方法、系統(tǒng)及相關(guān)裝置
- 一種結(jié)合注意力混合裁剪的細(xì)粒度圖像識別方法
- 基于分級式結(jié)構(gòu)的細(xì)粒度視頻動作識別方法





