[發明專利]基于元結構技術的全局引文推薦方法、推薦系統有效
| 申請號: | 201910326299.2 | 申請日: | 2019-04-23 |
| 公開(公告)號: | CN110083696B | 公開(公告)日: | 2022-11-25 |
| 發明(設計)人: | 趙姝;趙桓幜;陳喜;陳潔;段震;張燕平 | 申請(專利權)人: | 安徽大學 |
| 主分類號: | G06F16/335 | 分類號: | G06F16/335;G06F16/9535;G06F40/30 |
| 代理公司: | 合肥市浩智運專利代理事務所(普通合伙) 34124 | 代理人: | 王亞洲 |
| 地址: | 230000 *** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 結構 技術 全局 引文 推薦 方法 系統 | ||
本發明公開基于元結構技術的全局引文推薦方法,對原始數據集進行文章提取、詞頻統計、關鍵短語篩選數據清洗操作,得到文章并使用文章、文章的作者、出版商和術語信息構建文章庫;通過文章庫中文章以及文章的作者、出版商和術語,建立異構信息網絡;使用三度影響力原則選取三度以內的元結構,并依據所選的元結構和基于元結構的相似度計算技術得到文章庫中文章的相似度;提出方法為每個元結構加權來融合文章間基于不同元結構獲得的不同的相似度;使用優化算法優化以求得使推薦效果最優的權重;為每篇文章根據最優權重下的相似度和年份生成推薦列表。本發明通過元結構將語義信息融入到文章的相似性計算中,增強了引文推薦的可解釋性。
技術領域
本發明涉及信息推薦技術領域,尤其涉及基于元結構技術的全局引文推薦方法、推薦系統。
近年來,隨著科學技術的發展,學者們把撰寫論文作為展示自己科研成果的重要手段,隨之帶來的科研文獻數量飛速的增長。因此,如何準確地、高效地為科研人員推薦參考文獻是一個具有挑戰性的任務。全局引文推薦可以提高科研人員查找文獻的效率,增強初學者對當前領域的認知,同時一定程度上降低錯、漏引出現的概率。
如專利申請201511026567.7公開的一種基于文獻內容知識圖譜的多層引文推薦方法,首先獲取用戶的查詢需求,查詢需求由需要推薦引用論文或引用文獻的論文的標題和摘要的關鍵詞構成。然后,基于文獻內容的知識圖譜擴展查詢檢索詞語,知識圖譜由文獻的研究對象詞語和研究行為詞語結點,以及表示同義、近義、上下位、部分整體、并列等各種語義關系的邊構成。最后,構建數據集中文獻的倒排索引,選取候選引文,計算候選引文和查詢的相似度,采用梯度漸進回歸樹來進行引文推薦。
又如專利申請201810994562.0公開的一種基于神經機器翻譯技術的局部引文推薦方法及系統,通過對原始數據集進行引文提取、詞形還原、詞頻統計數據清洗操作,得到引文上下文與被引文章標題的平行語料并構建初始待被引文章列表庫;通過詞向量模型中的跳字模型結合負采樣的方法將引文上下文與被引文章標題中出現的詞嵌入到低維語義空間得到詞向量,構建一個帶有注意力機制的雙向門控循環單元的編碼器和門控循環單元的解碼器框架,將平行語料中的引文上下文通過詞向量模型轉換為詞向量后作為模型的輸入,被引文章標題作為輸出來訓練模型;將編碼器-解碼器框架輸出的種子標題與待被引文章列表中的所有文章標題逐條進行余弦相似度計算;依據文章年份,選取符合要求的文章作為推薦列表。
目前,全局引文推薦主要有兩種方法:(1)基于主題的方法;(2)基于圖結構的方法。其中基于主題的方法認為引文周圍的詞與引文外部的詞享有不同的主題分布,并根據引文上下文和文章主題的相關性來推薦引文?;趫D結構的方法相對于基于主題的方法增加了更多的限定條件,例如將論文合作者信息加入到引文推薦中,構建多層圖結構用以分析特征間的聯系。然而每張圖只能呈現出兩個特征間的關系(鄰接矩陣的行和列),這些分析方法并不能從全局的角度綜合的考量文章與多種特征之間的關系。兩種方法相比,基于主題適用于整理較為干凈的文本,對文章的內容信息要求較高。而基于圖結構的方法使用的文章特征較多,雖然精確度較高,但適用場景卻十分有限。
發明內容
本發明所要解決的技術問題在于如何通過增強了引文推薦的可解釋性來提高引文推薦的精確度。
本發明通過以下技術手段實現解決上述技術問題的:一種基于元結構技術的全局引文推薦方法,包括以下步驟:
S1、收集文章,構建原始數據集,原始數據集包括候選文章集與目標文章集;對原始數據集中的文章進行文章提取,得到文章的作者、出版商和術語,并使用文章、文章的作者、出版商和術語四種屬性構建文章庫;
S2、通過文章庫中文章的作者、文章、術語和出版商四種屬性建立異構信息網絡;
S3、列舉所有在異構信息網絡中度數在三以內的元結構,并依據所選的元結構和基于元結構的相似度得到文章庫中候選文章與目標文章的相似度;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于安徽大學,未經安徽大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910326299.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:技能服務調用方法、裝置及存儲介質
- 下一篇:一種中小企業公共服務系統





