[發(fā)明專利]一種基于中文評(píng)論情感引導(dǎo)的序列推薦方法及系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 202110588218.3 | 申請(qǐng)日: | 2021-05-28 |
| 公開(公告)號(hào): | CN113268667B | 公開(公告)日: | 2022-08-16 |
| 發(fā)明(設(shè)計(jì))人: | 鄭麟;周東霖;張志宏;鄭仰鑫;鄒振庭;張燕波 | 申請(qǐng)(專利權(quán))人: | 汕頭大學(xué) |
| 主分類號(hào): | G06F16/9535 | 分類號(hào): | G06F16/9535;G06F16/951;G06F40/253;G06N3/08;G06Q30/06 |
| 代理公司: | 廣州嘉權(quán)專利商標(biāo)事務(wù)所有限公司 44205 | 代理人: | 葉潔勇 |
| 地址: | 515063 *** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 中文 評(píng)論 情感 引導(dǎo) 序列 推薦 方法 系統(tǒng) | ||
1.一種基于中文評(píng)論情感引導(dǎo)的序列推薦方法,其特征在于,所述方法包括以下步驟:
步驟S100、獲取中文評(píng)論信息,基于所述中文評(píng)論信息確定評(píng)論文本集;
步驟S200、基于所述評(píng)論文本集生成情感矩陣,其中,所述情感矩陣SM包括:積極情感矩陣、消極情感矩陣、情感類別矩陣、以及置信度矩陣;
步驟S300、獲取用戶行為序列元組,基于所述用戶行為序列元組和情感矩陣確定序列化推薦模型;其中,所述序列化推薦模型包括自注意力機(jī)制模型和稀疏注意力模型;
步驟S400、基于所述序列化推薦模型生成用戶最終偏好;基于所述用戶最終偏好PF得到物品相關(guān)性高低的得分,將所述得分作為預(yù)測(cè)推薦物品的依據(jù);
其中,所述步驟S200包括:
步驟S210、對(duì)評(píng)論文本集進(jìn)行中文情感個(gè)性化挖掘,得到每個(gè)評(píng)論文本的情感數(shù)值;所述評(píng)論文本的情感數(shù)值包括:情感概率、情感類別、以及置信度;具體地,使用百度人工智能的自然語言處理API工具對(duì)評(píng)論文本進(jìn)行中文情感個(gè)性化挖掘;
步驟S220、采用等頻率均分方式將所有情感數(shù)值按個(gè)數(shù)均分成n份,使得每一份中情感數(shù)值的數(shù)量相等;
步驟S230、基于數(shù)據(jù)分箱方法將所述情感數(shù)值生成情感矩陣SM;其中,所述情感矩陣SM包括:積極情感矩陣、消極情感矩陣、情感類別矩陣、以及置信度矩陣,M表示情感矩陣的項(xiàng)數(shù),M=4;SM={Sp,Sn,Ss,Sc},Sp表示積極情感矩陣,Sn表示消極情感矩陣,Ss表示情感類別矩陣,Sc表示置信度矩陣,Sp,Sn,Ss,Sc∈R|S|×d,R|S|×d表示矩陣的形狀,d表示數(shù)據(jù)的潛在維度;
所述步驟S300包括:
步驟S310、獲取用戶行為序列元組((i1,S1),(i2,S2),…,(iq,Sq)),其中,iq表示第q個(gè)消費(fèi)物品,Sq表示第q個(gè)物品所對(duì)應(yīng)的情感矩陣;
步驟S320、以固定長(zhǎng)度將所述用戶行為序列元組劃分物品矩陣E,將所述物品矩陣和情感矩陣構(gòu)造為嵌入矩陣;其中,E∈R|I|×d,R|I|×d表示矩陣的形狀;
步驟S330、采用情感矩陣SM作為注意力機(jī)制的查詢Q,定義所述情感矩陣SM其中一個(gè)情感因素引導(dǎo)的自注意力模型為的計(jì)算公式為:
其中,Q代表注意力機(jī)制中的查詢,K代表注意力機(jī)制中的鍵,V代表注意力機(jī)制中的值,Sm為Sp,Sn,Ss,Sc其中一個(gè);WQ,WK,WV∈Rd×d,WQ表示Q的投影矩陣,WK表示K的投影矩陣,WV表示V的投影矩陣,Rd×d表示矩陣的形狀,d表示數(shù)據(jù)的潛在維度;
步驟S340、對(duì)基于情感引導(dǎo)的注意力和基于物品的自注意力AE進(jìn)行拼接,得到自注意力機(jī)制模型的拼接結(jié)果,所述自注意力機(jī)制模型拼接的計(jì)算公式如下:
其中,表示基于置信度矩陣引導(dǎo)的注意力,表示基于消極情感矩陣引導(dǎo)的注意力,表示基于積極情感矩陣引導(dǎo)的注意力;WE,o是注意力層輸出的維度,表示自注意力機(jī)制模型的拼接結(jié)果;
步驟S350、同時(shí)采用稀疏注意力模型對(duì)情感產(chǎn)生的偏好進(jìn)行獨(dú)立性建模,將積極情感矩陣、消極情感矩陣、情感類型矩陣以及置信度矩陣聚合得到聚合矩陣,基于所述聚合矩陣得到稀疏注意力模型,計(jì)算公式為:
其中,||運(yùn)算符表示僅使用距離小于或者等于r的兩個(gè)行為來計(jì)算注意力,AS4為聚合矩陣,r為稀疏率;
所述步驟S400包括:
步驟S410、基于所述自注意力機(jī)制模型的拼接結(jié)果的拼接結(jié)果得到第一用戶偏好PGu,基于所述稀疏注意力模型得到第二用戶偏好PGe;所述第一用戶偏好的計(jì)算公式為:其中,PGu表示第一用戶偏好;所述第二用戶偏好的計(jì)算公式為:其中,WP∈Ro×o,o是注意力層輸出的維度,PGe表示第二用戶偏好;具體地,對(duì)所述自注意力機(jī)制模型的拼接結(jié)果進(jìn)行規(guī)范化操作,再使用RNN模型對(duì)行為序列上的注意力進(jìn)行建模,獲得情感引導(dǎo)的用戶偏好,作為第一用戶偏好PGu;使用規(guī)范化操作和RNN模型計(jì)算純粹情感變化所產(chǎn)生的偏好,作為第二用戶偏好PGe;
步驟S420、將所述第一用戶偏好PGu和第二用戶偏好PGe聚合生成用戶最終偏好;所述用戶最終偏好的計(jì)算公式為:PF=WFLayerNorm(ConCat([PGu,PGe]))+BF,其中,WF和BF為訓(xùn)練參數(shù);具體地,通過將兩個(gè)通道所產(chǎn)生的兩種類型的偏好聚合生成用戶最終的偏好,雙通道模型統(tǒng)稱為CSAS模型,采用二進(jìn)制交叉熵?fù)p失和Adam優(yōu)化器來訓(xùn)練CSAS模型;
步驟S430、通過所述用戶最終偏好PF得到物品相關(guān)性高低的得分,基于所述得分預(yù)測(cè)推薦物品。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于汕頭大學(xué),未經(jīng)汕頭大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110588218.3/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 全球評(píng)論板系統(tǒng)及其實(shí)現(xiàn)方法
- 一種評(píng)論推薦方法和系統(tǒng)
- 評(píng)論內(nèi)容的提供方法、裝置和終端設(shè)備
- 評(píng)論信息確定方法、裝置、服務(wù)器及存儲(chǔ)介質(zhì)
- 基于人工智能構(gòu)建評(píng)論圖譜的方法和裝置
- 一種電子商務(wù)產(chǎn)品評(píng)論質(zhì)量鑒別系統(tǒng)
- 音頻文件的評(píng)論方法及裝置
- 評(píng)論的展示方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 在線評(píng)論篩選裝置
- 用于生成評(píng)論的方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)





