[發明專利]一種基于用戶偏好與知識圖譜的個性化產品描述生成方法在審
| 申請號: | 202110236093.8 | 申請日: | 2021-03-03 |
| 公開(公告)號: | CN113032415A | 公開(公告)日: | 2021-06-25 |
| 發明(設計)人: | 郭斌;郝少陽;於志文;梁韻基;王柱 | 申請(專利權)人: | 西北工業大學 |
| 主分類號: | G06F16/24 | 分類號: | G06F16/24;G06F16/36 |
| 代理公司: | 西北工業大學專利中心 61204 | 代理人: | 金鳳 |
| 地址: | 710072 *** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 用戶 偏好 知識 圖譜 個性化 產品描述 生成 方法 | ||
1.一種基于用戶偏好與知識圖譜的個性化產品描述生成方法,其特征在于,包括以下步驟:
步驟1:獲取產品描述數據集,采集互聯網電商網站中的產品描述Y=(y1,y2,...yn)、產品標題X=(x1,x2,...xm)、與用戶評論數據userid,userreview;
步驟2:以產品標題中的實體在知識庫中進行檢索,將檢索出的知識G分為兩個部分:關系r=DESC的知識表示為G1=Gr=DESC,剩余的知識表示為G2=Gr≠DESC;使用TransE將知識庫中檢索到的實體與關系映射到低維空間;
步驟3:將知識庫中檢索到的知識G1所包含三元組K1中的值按照它們對應的實體在產品標題X中的順序進行拼接,然后使用雙向GRU對K1進行編碼;
使用Attention機制選擇知識,Attention機制描述為式(1):
其中,為編碼階段的第i個時間步的隱狀態,是解碼階段第t個時間步的隱向量,Wk,W′k,bk和v是需進行學習的參數,v用于調整權重的維度,j表示時間步,為用Attention機制選擇結果的上下文向量;
步驟4:將知識庫中檢索到的知識G2,使用TransE將知識G2中所有的實體與關系映射為低維向量,知識G2的三元組K2被映射為τ=(e,r,val)=MLP(TransE(e,r,val)),其中τ,e,r和val分別為τ,e,r和val的TransE向量表示,MLP是全連接神經網絡,用于消除結構化數據與非結構化的文本數據之間的隔閡,τ為映射后的三元組,e表示實體,val表示值;
使用GraphAttention對檢索出的知識進行選擇與整合,如以下式(2)所示:
其中,rn,與valn分別是gi中第n個三元組的實體、關系與值;αn為Attention權重,αn用來衡量關系rn與實體和值valn之間連接的緊密性;表示將xi作為關鍵實體從G2中抽取得到的信息;和為可學習參數;
將與xi進行拼接,將拼接后的向量輸入編碼時的每一個GRU單元;
步驟5:由步驟1采集的用戶評論數據對用戶進行分類,根據用戶類別獲取該類別對應的產品描述,使用TF-IDF從產品描述中選取詞匯構成用戶專屬個性化詞庫Vu;
使用Attention機制對個性化詞庫Vu中的詞匯進行選取,表示為式(3):
其中,為用戶專屬詞庫中第i個詞匯的編碼表示,,Wv,W′k與bv均為可學習的參數,mT為進行維度變換的矩陣,即為計算出的第i個詞匯的權重,表示上下文向量;
步驟6:使用多重指針生成網絡計算從知識庫、個性化詞庫和產品標題中進行單詞復制時的生成概率,表示為式(4):
其中,Pk、Pv、Pg分別為從知識庫、個性化詞庫和產品標題中進行單詞復制時的生成概率,σ為系數,均為可學習參數,xt為為輸入詞匯的編碼向量;
步驟7:計算最終生成的個性化產品描述詞匯概率,表示為式(5):
其中與為當生成第t個詞匯時,分別從知識庫、個性化詞庫與產品標題中選取第i個詞的權重信息,Wp為可學習的參數,pvoc(w)為僅考慮生成模型部分的生成概率,P(w)為最終生成的產品描述中下一個詞匯的概率分布,概率最大值對應的即為預測詞匯。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西北工業大學,未經西北工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110236093.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:智能學習桌以及智能學習桌的成長監測方法
- 下一篇:一種腰部外骨骼機器人





