[發明專利]基于多模型集成的學者年齡預測方法、裝置、設備和介質在審
| 申請號: | 202011205712.9 | 申請日: | 2020-11-02 |
| 公開(公告)號: | CN112330008A | 公開(公告)日: | 2021-02-05 |
| 發明(設計)人: | 王茜;酈蘇菲;王楊;阮妹;魏家佳 | 申請(專利權)人: | 上海市研發公共服務平臺管理中心 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06N3/08 |
| 代理公司: | 上海光華專利事務所(普通合伙) 31219 | 代理人: | 李治東 |
| 地址: | 200235 上海*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 模型 集成 學者 年齡 預測 方法 裝置 設備 介質 | ||
1.一種基于多模型集成的學者年齡預測方法,其特征在于,所述方法包括:
將基于學者的學術發表成果所提取到的多種指標信息進行清洗及融合處理以作為對應學者的初始學術特征;
將各所述初始學術特征輸入以學者年齡作為輸出結果進行訓練的XGBoost模型,以得到第一預測結果;同時,將初始學術特征進行正態分布標準化,并輸入以學者年齡作為輸出結果進行訓練的三層神經網絡模型,以得到第二預測結果;
將所述第一預測結果與所述第二預測結果求平均值以作為最終預測年齡。
2.根據權利要求1所述的方法,其特征在于,所述指標信息的類型包括:時間點指標、時間段指標、發文量相關數量指標、合作者相關數量指標、發文被引指標、學科領域、及文章類型指標中任意一種或多種組合。
3.根據權利要求1或2所述的方法,其特征在于,所述指標信息包括:直接從學術發表成果中提取的原始指標信息、以及對所述原始指標信心進行數據加工得到的衍生指標信息;
所述衍生指標信息包括:H指數、FWCI、學者的學術年齡、作為第一作者的學術年齡、及發文量加速度中任意一種或多種組合。
4.根據權利要求1所述的方法,其特征在于,所述XGBoost模型經調參得到的模型參數的學習率為0.09,樹的最大深度為2,屬性采樣比為0.8,boosting輪數為290。
5.根據權利要求4所述的方法,其特征在于,所述XGBoost模型是基于GBDT模型的基礎上改進得到的;所述改進點包括:增加了對模型復雜度進行約束的正則化項;以及除了一階導同時計算了二階導對參數進行迭代。
6.根據權利要求1所述的方法,其特征在于,基于所述XGBoost模型還能得到各初始學術特征的重要度排名,以供篩選基于學者的學術發表成果所提取的指標信息。
7.根據權利要求1所述的方法,其特征在于,所述三層神經網絡模型的三層神經網絡結構包括:兩個隱藏層、及一個輸出層;所述隱藏層的神經元數設為13;所述隱藏層的激活函數為LeakyReLU,并且都有標準化層;優化器為ADAM,損失函數為平均絕對百分比誤差MAPE;迭代數量為200,batch_size為32。
8.一種電子裝置,其特征在于,所述裝置包括:
數據處理模塊,用于將基于學者的學術發表成果所提取到的多種指標信息進行清洗及融合處理以作為對應學者的初始學術特征;
XGBoost模型模塊,用于將所述初始學術特征輸入以學者年齡作為輸出結果進行訓練的XGBoost模型,以得到第一預測結果;
三層神經網絡模型模塊,用于將初始學術特征進行正態分布標準化,并輸入以學者年齡作為輸出結果進行訓練的三層神經網絡模型,以得到第二預測結果;
集成模塊,用于將所述第一預測結果與所述第二預測結果求平均值以作為最終預測年齡。
9.一種計算機設備,其特征在于,所述設備包括:存儲器、及處理器;所述存儲器用于存儲計算機指令;所述處理器運行計算機指令實現如權利要求1至7中任意一項所述的方法。
10.一種計算機可讀存儲介質,其特征在于,存儲有計算機指令,所述計算機指令被運行時執行如權利要求1至7中任一項所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海市研發公共服務平臺管理中心,未經上海市研發公共服務平臺管理中心許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011205712.9/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種預制磚塊夾持吊裝裝置
- 下一篇:一種中性浮力機器人一致性容錯控制方法
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





