[發明專利]融合標題摘要語義關系的學術文獻推薦方法在審
| 申請號: | 202210270510.5 | 申請日: | 2022-03-18 |
| 公開(公告)號: | CN114626369A | 公開(公告)日: | 2022-06-14 |
| 發明(設計)人: | 陳澤華;陳雨民;呂傳建;閆一帆 | 申請(專利權)人: | 太原理工大學 |
| 主分類號: | G06F40/258 | 分類號: | G06F40/258;G06F40/30;G06F16/9535;G06N3/04;G06N3/08 |
| 代理公司: | 太原晉科知識產權代理事務所(特殊普通合伙) 14110 | 代理人: | 任林芳 |
| 地址: | 030024 *** | 國省代碼: | 山西;14 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 融合 標題 摘要 語義 關系 學術 文獻 推薦 方法 | ||
本發明屬于學術文獻推薦領域,具體是一種融合標題摘要語義關系的學術文獻推薦方法。解決了現有學術文獻推薦方法存在的冷啟動,數據稀疏性問題,包括以下步驟,S100:采集用戶?文獻交互數據并進行數據預處理;S200:搭建結合文本與隱反饋信息的學術文獻推薦網絡;S300:將預處理后的數據集輸入文獻推薦網絡,使用損失函數對文獻推薦網絡進行訓練,并保存訓練好的網絡模型及參數;S400:使用訓練好的網絡計算每位用戶對其它所有未交互過的文獻的喜好分數,根據喜好分數對文獻進行排序,選取前N篇文獻推薦給用戶。本發明有效保證學術文獻推薦效果。
技術領域
本發明屬于學術文獻推薦領域,具體是一種融合標題摘要語義關系的學術文獻推薦方法。
背景技術
學術文獻是學者們在科學研究后,通過文章對自己的研究內容、方法、實驗結果以及結論等進行總結凝練,是針對某一問題的系統性闡述與討論,是一種有形的知識載體,具有極高價值。學者們通過學術文獻獲取某個學科或領域的最新研究進展、研究現狀等科研信息,激發科學研究動機的出現和學術靈感的涌現。傳統學術文獻獲取方式是閱讀紙質文獻,互聯網時代,文獻獲取變的十分容易。互聯網上充斥著大量學術文獻,文獻在信息世界里被不斷轉發、傳播擴散,如何幫助研究者快速找到感興趣的學術文獻具有十分重要的意義,推薦系統為此打開了一種全新方式。
為了推動智慧圖書館的發展,必須充分利用海量資源數據,融合新興技術,提升圖書館館藏資源的利用率和用戶滿意度。推薦服務是當下圖書館個性化服務的核心內容,是圖書館將傳統被動服務轉變為主動服務的重要途徑和方式,可以有效提高館藏學術資源的利用率和用戶滿意度,為構建智能化、個性化、自動化的圖書館服務奠定基礎。
基于內容過濾的文獻推薦方法存在特征抽取表示效率低,推薦缺乏多樣性和新穎性等問題。基于協同過濾的文獻推薦方法提高了推薦文獻的新穎性和多樣性,但單純使用協同過濾方法進行學術文獻推薦將面臨嚴重的數據稀疏問題。基于圖的推薦假設引文拓撲能夠準確反映文獻之間的關聯性,但該假設存在一些缺陷,新文獻無法被舊文獻引用,一些作者可能引用自己的無關的文獻。混合推薦旨在將多個推薦方法結合起來彌補單個推薦方法存在的缺陷,是目前學術文獻推薦的主流方向。現存方法都沒有重視文獻內容對于研究人員的關鍵作用,沒有充分利用學術文獻作為一種典型的結構化文本的特點。
發明內容
本發明為了解決現有學術文獻推薦方法存在的冷啟動,數據稀疏性問題,提供一種融合標題摘要語義關系的學術文獻推薦方法。
本發明采取以下技術方案:一種融合標題摘要語義關系的學術文獻推薦方法,包括以下步驟,S100:采集用戶-文獻交互數據并進行數據預處理;S200:搭建結合文本與隱反饋信息的學術文獻推薦網絡,文獻推薦網絡首先通過預訓練BERT模型獲得標題摘要中單詞的向量表示,接著通過標題摘要注意力機制捕獲標題摘要之間語義關系獲得更好的文獻向量表示,最后結合去掉項目嵌入模塊的NCF模型處理用戶-文獻交互信息實現文獻推薦;S300:將預處理后的數據集輸入文獻推薦網絡,使用損失函數對文獻推薦網絡進行訓練,并保存訓練好的網絡模型及參數;S400:使用訓練好的網絡計算每位用戶對其它所有未交互過的文獻的喜好分數,根據喜好分數對文獻進行排序,選取前N篇文獻推薦給用戶。
步驟S100中,用戶-文獻交互數據為某位用戶歷史上是否收藏、瀏覽、點擊過某篇文獻,是則存在交互對,否則不存在,具體包括每個用戶歷史上交互過的文獻以及對應文獻的標題摘要文本。
步驟S100中,數據預處理包括數據集的清洗和負采樣,其中數據集的清洗包括合并重復文章、移除無效文章、去除收藏少于10篇文獻的用戶;負采樣為對每對交互按比例隨機選取幾對不存在的交互。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于太原理工大學,未經太原理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210270510.5/2.html,轉載請聲明來源鉆瓜專利網。





