[發明專利]一種面向項目需求的科技專家智能推薦方法有效
| 申請號: | 202110654909.9 | 申請日: | 2021-06-11 |
| 公開(公告)號: | CN113377945B | 公開(公告)日: | 2023-04-07 |
| 發明(設計)人: | 黃煜鵬;穆磊;鄧蔚;曾剛;翁智蓉 | 申請(專利權)人: | 成都工物科云科技有限公司 |
| 主分類號: | G06F16/335 | 分類號: | G06F16/335;G06F18/2113;G06F18/2413;G06F18/214 |
| 代理公司: | 北京天奇智新知識產權代理有限公司 11340 | 代理人: | 王大剛 |
| 地址: | 610200 四川省成都市東升街道*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 面向 項目 需求 科技 專家 智能 推薦 方法 | ||
1.一種面向項目需求的科技專家智能推薦方法,其特征在于,包括:
S1、導入論文訓練樣本訓練論文詞嵌入模型和KNN召回模型,獲得優化后的論文詞嵌入模型和KNN召回模型;
S2、項目需求導入到優化后的論文詞嵌入模型獲取該項目需求的需求向量;
S3、需求向量輸入到優化后的KNN召回模型獲取相似論文集合,并根據相似論文集合獲取專家待推薦集合;
S4、根據專家待推薦集合獲取每位候選專家的論文成果集;
S5、排序層模型根據論文成果集計算每位候選專家的評分,按照評分高低排序取出topN反饋推薦結果,具體包括:
S51、將每位候選專家的論文成果集嵌入得到論文向量,構成文檔矩陣;
S52、度量該候選專家每篇論文的論文向量與需求向量的相似度,表示為其中,u表示需求向量,p表示論文向量,|u|表示特征向量模長;
S53、根據論文的被引數、下載數度量論文的質量,其中,cp表示論文的被引數,dp表示論文的下載數,通常情況下論文的下載數遠多于被引數,其重要程度比被引數低,因此得分占比更低;
根據論文發表的時間確定論文的時間懲罰,其中,yc表示當前年份,yp表示論文的發表年份,該算法可以根據α來調整效果,α越大其懲罰力度越小,時間因子影響程度越小;
根據論文發表中的排名順序度量該候選專家在論文中的貢獻程度,其中index(ep,p)為專家ep在論文p中的排名順序,dep為專家的論文作品集合,β用于調節順序對分數的影響,其算法本質是對該順序進行softmax計算;
S54、采用高斯核函數度量該候選專家每篇論文的論文向量與需求向量的相關度,表示為P代表論文向量,u代表需求向量,σ值主要是用于函數調節,當σ越小,僅僅只有最接近于需求向量的論文向量才能得到較高的分數;
S55、根據相似度、論文質量、時間懲罰、排名順序和相關度對每篇論文中該候選專家進行基礎評分,表示為Rate(u,p,ep)=cos(u,p)*R(ep)*T(p)*Q(p)*G(u,p);
S56、根據該候選專家所有論文的基礎評分與需求向量進行運算求和,得到該候選專家最終的評分,表示為Rank(u,ep)=∑p∈(p1,…,pn)Rate(u,p,ep),其中(p1,…,pn)為專家ep的論文作品集;
S57、根據所有候選專家最終的評分進行排序,按照評分高低排序取出topN反饋推薦結果。
2.根據權利要求1所述的一種面向項目需求的科技專家智能推薦方法,其特征在于,在S1中,論文詞嵌入模型包括分詞層、Word2vec層、TF-IDF層和輸出層,訓練論文詞嵌入模型包括:
S11、提取每個論文訓練樣本的標題、關鍵詞和摘要融合為一個組合文檔,并通過分詞層過濾停用詞;
S12、過濾后的組合文檔導入Word2vec層獲得語料庫中每個詞的詞向量A;
S13、標題、關鍵詞和摘要分別作為單一文檔導入Word2vec層獲得各自單一文檔的詞向量B;
S14、詞向量B導入TF-IDF層計算詞權重再取平均值獲得TF-IDF加權的詞向量C;
S15、三個詞向量C再次賦予標題、關鍵詞和摘要的權重并取均值后獲得論文向量。
3.根據權利要求2所述的一種面向項目需求的科技專家智能推薦方法,其特征在于,在S1中,標題、關鍵詞和摘要的權重分別為0.45、0.3、0.25。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于成都工物科云科技有限公司,未經成都工物科云科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110654909.9/1.html,轉載請聲明來源鉆瓜專利網。





