[發明專利]學者遷徙路線構建方法及裝置有效
| 申請號: | 202010311548.3 | 申請日: | 2020-04-20 |
| 公開(公告)號: | CN111538917B | 公開(公告)日: | 2022-08-26 |
| 發明(設計)人: | 唐杰;邵洲;袁莎;劉德兵 | 申請(專利權)人: | 清華大學 |
| 主分類號: | G06F16/9537 | 分類號: | G06F16/9537;G06F16/951 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 王艷斌 |
| 地址: | 10008*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 學者 遷徙 路線 構建 方法 裝置 | ||
本發明公開了一種學者遷徙路線構建方法及裝置,其中,方法包括以下步驟:將論文信息轉化為隸屬信息;在隸屬信息進行向量化處理,并通過深度學習方式確定每個學者的在每個工作地點的可能性概率;根據可能性概率使用工作地點選擇機制和補充缺失地點生成學者遷徙路線。該方法可以利用科研大數據中學者的科研成果信息和合作關系網絡中蘊含的信息生成準確率較高的學者遷徙路線,能夠很好地利用數據中的隱含信息,識別不正確的工作地點,有效提高遷徙路線構建的準確性,簡單易實現。
技術領域
本發明涉及計算機網絡信息技術領域,特別涉及一種學者遷徙路線構建方法及裝置。
背景技術
傳統的學者遷徙路線的構建主要是經過人工處理或者較粗粒度的處理,如進行國家層面的宏觀分析等。Moedet等人提出了基于Scopus的同行評議期刊上發表論文的作者所屬國家的方法進行學者遷徙分析。近年來,Shao等人提出了使用科研大數據還原學者遷徙的思路,并構建了一個簡單的框架。其主要思想是利用學者的論文信息,但是其準確率并不是很高。Markova等人Web of Science的數據研究俄羅斯學者在全球的流動。
這些方法大多都用到了學者的科研成果信息,但是沒有考慮學者命名排歧、數據噪聲等一系列的問題,往往只能反映現象,并不能很好地提高學者遷徙的準確性,有待解決。
發明內容
本發明旨在至少在一定程度上解決相關技術中的技術問題之一。
為此,本發明的一個目的在于提出一種學者遷徙路線構建方法,該方法可以利用科研大數據中學者的科研成果信息和合作關系網絡中蘊含的信息生成準確率較高的學者遷徙路線,能夠很好地利用數據中的隱含信息,識別不正確的工作地點,有效提高遷徙路線構建的準確性,簡單易實現。
本發明的另一個目的在于提出一種學者遷徙路線構建裝置。
為達到上述目的,本發明一方面實施例提出了一種學者遷徙路線構建方法,包括以下步驟:將論文信息轉化為隸屬信息;在所述隸屬信息進行向量化處理,并通過深度學習方式確定每個學者的在每個工作地點的可能性概率;根據所述可能性概率使用工作地點選擇機制和補充缺失地點生成學者遷徙路線。
本發明實施例的學者遷徙路線構建方法,使用學者的科研成果信息及合作者關系網絡為學者每一年所發表論文的工作地點建立特征向量,然后根據該特征向量判斷該地點的正確性,并根據框架所構建的上下文估計學者正確的工作地點,以還原學者的遷徙路線實現學者遷徙路線的構建,從而利用科研大數據中學者的科研成果信息和合作關系網絡中蘊含的信息生成準確率較高的學者遷徙路線,能夠很好地利用數據中的隱含信息,識別不正確的工作地點,有效提高遷徙路線構建的準確性,簡單易實現。
另外,根據本發明上述實施例的學者遷徙路線構建方法還可以具有以下附加的技術特征:
進一步地,在本發明的一個實施例中,所述將論文信息轉化為隸屬信息,包括:根據學者-論文-合作者-隸屬機構每年關系,將學者s所有論文P及合作者的論文P'中的每一篇p中的學者A和隸屬B轉化為B=A*U的形式;將所述學者s所有論文P及合作者的論文P'中的affiliation編碼為經緯度信息;對所有affiliation中的機構進行抽取,并轉化為學者ID、機構名稱、年份、地理位置信息的四元組。
進一步地,在本發明的一個實施例中,所述通過深度學習方式確定每個學者的在每個工作地點的可能性概率,包括:根據所述四元組和學者合作關系網絡對所述隸屬信息進行向量化處理;采用基于深度學習的方法輸入向量并計算每一組向量的為真的概率,以輸出的結果為候選集C,每一年學者對應的候選集為Cy,Cy表示學者這一年可能呆的工作地點及其概率。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清華大學,未經清華大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010311548.3/2.html,轉載請聲明來源鉆瓜專利網。





