[發明專利]基于多層注意力機制并融合圖譜的水利門戶信息推薦方法有效
| 申請號: | 202010601160.7 | 申請日: | 2020-06-29 |
| 公開(公告)號: | CN111914895B | 公開(公告)日: | 2022-08-26 |
| 發明(設計)人: | 張鵬程;高橙 | 申請(專利權)人: | 河海大學 |
| 主分類號: | G06V10/762 | 分類號: | G06V10/762;G06V10/80;G06V10/82;G06K9/62;G06N3/04;G06N3/08;G06Q50/06 |
| 代理公司: | 南京蘇高專利商標事務所(普通合伙) 32204 | 代理人: | 孟紅梅 |
| 地址: | 210024 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 多層 注意力 機制 融合 圖譜 水利 門戶 信息 推薦 方法 | ||
1.一種基于多層注意力機制并融合圖譜的水利門戶信息推薦方法,其特征在于,包括如下步驟:
(1)收集各大水利門戶網站中的水利信息數據并進行預處理操作增加區域特征;
(2)使用Doc2Vec模型獲得水利信息標題以及水利信息正文的文本表示向量,為特征集增加標題特征和正文特征向量;
(3)對標題和正文的文本表示向量進行聚類,并用手肘法確定出最終的文本主題類別個數,增加主題特征;
(4)將區域特征、主題特征、發布時間特征通過嵌入操作轉換為與標題和正文特征相同維度的向量,形成最終的特征集;
(5)將特征集輸入到特征級注意力機制中,對各個特征進行融合后,得到用戶瀏覽過的每條水利信息的初步表示向量;
(6)收集每條水利信息的地區、時間和主題,構建水利信息圖譜,并訓練出圖譜中每個實體的向量,將每條水利信息中的實體及融合圖譜擴展后的實體的向量求平均,并與步驟(5)得到的初步表示向量相加得到水利信息的最終表示向量;
(7)將水利信息的最終表示向量輸入到具有位置編碼的自注意力機制,學習出用戶每一個行為的表示向量;
(8)以待推薦水利信息為查詢項,用戶行為的表示向量為鍵項,利用注意力機制進行對鍵項加權求和得到用戶的興趣表示向量;
(9)計算用戶的興趣表示向量與待推薦水利信息的相關性,得到最終給用戶進行推薦的列表。
2.根據權利要求1所述的一種基于多層注意力機制并融合圖譜的水利門戶信息推薦方法,其特征在于,所述步驟(1)包括:
(11)使用爬蟲收集各大水利門戶網站的水利信息數據,包括發布時間、水利信息標題、水利信息正文字段;
(12)初步處理數據,將數據中存在缺失的,含有異常值的相關數據刪除;
(13)根據用戶的歷史點擊水利信息行為序列,選取一個時間點對行為序列進行分割,形成訓練集和測試集,時間點之前的行為序列為訓練集,之后的為測試集;
(14)基于信息來源或內容為每條水利信息添加區域字段,為特征集增加區域特征。
3.根據權利要求1所述的一種基于多層注意力機制并融合圖譜的水利門戶信息推薦方法,其特征在于,所述步驟(2)包括:
(21)對收集到的水利信息數據中的水利信息標題以及正文進行去除停用詞和分詞操作;
(22)利用Doc2Vec模型中的PV-DM模型將標題和正文分別表示成向量的形式,作為標題特征和正文特征向量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于河海大學,未經河海大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010601160.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:死時間校正方法、裝置、計算機設備和存儲介質
- 下一篇:一種多合缸空氣透平機組





