[發明專利]一種面向學術精準推薦的異質科研信息集成方法及系統有效
| 申請號: | 202110732872.7 | 申請日: | 2021-06-30 |
| 公開(公告)號: | CN113343125B | 公開(公告)日: | 2023-08-22 |
| 發明(設計)人: | 張凱;王楚豫;葉保留 | 申請(專利權)人: | 南京大學 |
| 主分類號: | G06F16/9536 | 分類號: | G06F16/9536;G06N3/0475;G06N3/0464;G06N3/094;G06N3/084;G06F18/22 |
| 代理公司: | 南京泉為知識產權代理事務所(特殊普通合伙) 32408 | 代理人: | 許丹丹 |
| 地址: | 210023 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 面向 學術 精準 推薦 科研 信息 集成 方法 系統 | ||
1.一種面向學術精準推薦的異質科研信息集成方法,其特征在于,包括以下步驟:
S1、對異質的原始科研信息進行預處理,包括:分別將異質的學術文獻信息編碼成向量模式,并抽取語義相關的學術特征向量,用于編碼訓練;并對學術特征向量的一些條目進行隨機置空,構造隨機異質的科研信息;
S2、對于預處理獲得的學術信息特征向量和異質科研信息進行編碼,并構建學術編碼映射模型,所述學術編碼映射模型利用多重卷積層構建生成對抗網絡,用于從異質的科研信息中獲得完整特征向量的映射;
S3、利用生成對抗網絡的生成器部分,實現異質學術信息到學術信息特征向量的轉化,將異質、存在缺失條目的科研信息進行補全并生成完整的科研信息特征向量;
S4、將作者信息編碼成稀疏的獨熱向量,并標記作者信息的獨熱向量與科研信息特征向量之間的相關程度;
S5、利用作者信息的獨熱向量、科研信息特征向量以及作者信息的獨熱向量與科研信息特征向量之間的相關程度,訓練協同過濾推薦模型,用于生成與作者相關的推薦集合;
S6、融合基于協同過濾的作者-文獻相關性推薦以及基于生成對抗網絡的文獻-文獻相關性推薦,得到最終的推薦結果,完成學術文獻的精準推薦。
2.根據權利要求1所述的面向學術精準推薦的異質科研信息集成方法,其特征在于,所述步驟S1包括:針對特定來源的每一篇科研論文的原始信息進行預處理,抽取以下幾個指標構建原始信息:
[作者1,作者2,……,作者n,研究領域,論文名稱,論文關鍵詞,收錄時間,論文摘要]
將指標數據齊全的原始信息作為標簽;通過將其中的隨機部分字段置空,作為訓練數據,將標簽與訓練數據一一對應,作為原始數據訓練集。
3.根據權利要求2所述的面向學術精準推薦的異質科研信息集成方法,其特征在于,所述步驟S2對于預處理獲得的學術信息特征向量和異質科研信息進行編碼包括:將原始數據訓練集中每個詞語都映射成詞向量Vi,將原始特征的所有信息映射之后進行堆疊,得到預處理的矩陣Mk=[Vector1,Vector2,Vector3,Vector4,......Vectorn],相應的,對于此訓練數據,有標簽:對于一組科研數據,則產生訓練集中的多組數據
4.根據權利要求3所述的面向學術精準推薦的異質科研信息集成方法,其特征在于,所述步驟S2中學術編碼映射模型使用生成對抗模型,該模型使用生成對抗學習的方式,生成器與判別器通過卷積層來對信息進行抽取,其中每一層的計算方式如下:
其中,m表示第l-1層網絡輸出向量的維度,表示第l-1層網絡的第i個輸出參數,表示第l層網絡的第j個輸出參數,是第l層網絡的參數,是第l層的偏置,f是所選取的激活函數;
生成對抗模型的計算目標公式為:
A=argminG(argmaxDValue(G,D))
Value(D,G)=Ex~Pdata(x)[logD(x)]+Ez~Pdata(z)[1-logD(G(z))]
其中G為生成器,D為判別器,E為交叉熵誤差,A表示優化目標,Value(G,D)表示在生成器為G、判別器為D的情況下計算的反向傳播誤差,z表示生成器輸入的隱藏變量,Ex~Pdata(x)表示在x服從其原始分布Pdata(x)時,使用交叉熵對誤差進行計算;同樣地,Ez~Pdata(z)表示在z服從Pdata(z)分布時,使用交叉熵對誤差進行計算。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京大學,未經南京大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110732872.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:汽車后背門定位結構及其定位方法
- 下一篇:FRP筋連接裝置及其連接方法





