[發明專利]一種基于多維度特征的新聞推薦方法在審
| 申請號: | 202210025279.3 | 申請日: | 2022-01-11 |
| 公開(公告)號: | CN114357307A | 公開(公告)日: | 2022-04-15 |
| 發明(設計)人: | 郭楠;李金輝;高燊;高天寒 | 申請(專利權)人: | 東北大學 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/9536;G06Q50/00;G06F16/28 |
| 代理公司: | 沈陽東大知識產權代理有限公司 21109 | 代理人: | 李在川 |
| 地址: | 110819 遼寧*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 多維 特征 新聞 推薦 方法 | ||
1.一種基于多維度特征的新聞推薦方法,其特征在于,包括如下步驟:
步驟1:構建新聞特征提取器,提取新聞特征ra;
步驟2:構建用戶特征處理器,將每篇新聞經過注意力網絡得到的注意力權重乘以各自經過步驟1的新聞特征提取器提取得到的新聞特征,得到用戶特征u;
步驟3:將用戶特征u和新聞特征ra相乘得到每篇新聞的點擊概率得分
步驟4:隨機從多個用戶的交互記錄中抽取K篇用戶未點擊的新聞作為負樣本,抽取一篇用戶點擊過的新聞作為正樣本,所有的用戶數據組合在一起構成訓練集,計算訓練集正樣本的點擊概率得分pi,并定義點擊率損失函數L;
步驟5:將多個用戶的交互記錄輸入深度學習的batch中,重復執行步驟1至步驟4進行深度學習模型的訓練;
步驟6:將用戶歷史瀏覽新聞和候選新聞輸入步驟5訓練好的深度學習模型中,進行首頁推薦或個性化推薦。
2.根據權利要求1所述的基于多維度特征的新聞推薦方法,其特征在于,所述步驟1的過程如下:
步驟1.1:獲取新聞,從新聞標題的文本中提取實體信息和關系信息,構建知識圖譜;并從構建的知識圖譜中學習實體向量和關系向量,計算每個實體的上下文向量的平均值;
步驟1.2:獲得新聞標題中每個詞的詞向量,與實體向量和實體的上下文向量的平均值一同映射到相同維度的向量空間中,并輸入到動態多卷積核CNN中進行特征提取,得到相應的詞特征、實體特征和實體上下文特征;
步驟1.3:分別計算步驟2得到的詞特征、實體特征、實體上下文特征相應的權重值,并分別乘以對應的詞特征、實體特征和實體上下文特征,然后相加得到最終的標題特征rt;
步驟1.4:使用k-means均值聚類算法對新聞標題的文本進行聚類分析,獲取聚類后的質心,并將k個質心對應到k個類別,得到新聞標題文本聚類的類別特征表示rcq;
步驟1.5:從新聞中獲取一幅配圖,對圖像進行轉化得到RGB圖,將RGB圖像顏色空間轉換到HSV顏色空間,并對其中的色調H、飽和度S和亮度V進行計算,得到圖像的顏色特征;
步驟1.6:對于每幅圖像f(x,y)計算其幾何不變矩,并使用幾何不變矩來描述圖像的形狀特征;
步驟1.7:對于每幅圖像f(x,y)計算其灰度共生矩陣,并使用灰度共生矩陣來描述圖像的紋理特征;
步驟1.8:分別計算每一張新聞圖像的顏色、形狀和紋理特征的特征相似度,并根據特征相似度計算結果動態調整閾值,建立每一張新聞圖像特征的知識圖譜子圖,把所有知識圖譜子圖鏈接到一起,得到新聞圖像特征的知識圖譜;
步驟1.9:將圖像的顏色、形狀和紋理特征表示為知識圖譜中的頭實體向量和尾實體向量,特征之間的相似度表示為關系向量,將頭實體向量、尾實體向量和關系向量使用TransE0模型進行過濾;
步驟1.10:將圖像的顏色、形狀和紋理特征進行線性融合得到圖像的特征向量D;
步驟1.11:獲取新聞類別ID,并獲取該類別ID所對應的初始特征,將初始特征輸入到Dense中得到新聞類別ID的特征表示rca;
步驟1.12:將新聞類別ID的特征rca、新聞標題文本聚類的類別特征rcq、新聞標題特征rt、圖像特征D用注意力機制融合在一起,作為最終的新聞特征ra。
3.根據權利要求2所述的基于多維度特征的新聞推薦方法,其特征在于,所述步驟1.1的過程如下:
步驟1.1.1:基于命名實體識別技術對新聞標題進行實體抽取,將抽取得到的實體組合成新聞實體集合;
步驟1.1.2:將新聞標題和對應的實體輸入到PCNN中進行關系抽取,形成三元組(h,r,t);其中,h為頭部實體、t為尾部實體,h和t均來自新聞實體集合,r為關系,由PCNN抽取后得到;
步驟1.1.3:以三元組(h,r,t)為基礎構建知識圖譜;
步驟1.1.4:使用知識圖譜特征學習方法,從構建的知識圖譜中學習實體向量和關系向量;
步驟1.1.5:提取每個實體的上下文信息,即獲取每個實體在圖譜中的鄰居,并計算每個實體的上下文向量的平均值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東北大學,未經東北大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210025279.3/1.html,轉載請聲明來源鉆瓜專利網。





