[發明專利]基于學者科研成果挖掘的學者精準定位方法及裝置有效
| 申請號: | 201811149733.6 | 申請日: | 2018-09-29 |
| 公開(公告)號: | CN109359249B | 公開(公告)日: | 2020-07-10 |
| 發明(設計)人: | 唐杰;邵洲;高博;劉德兵 | 申請(專利權)人: | 清華大學 |
| 主分類號: | G06F16/9537 | 分類號: | G06F16/9537 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 張潤 |
| 地址: | 10008*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 學者 科研成果 挖掘 精準 定位 方法 裝置 | ||
本發明公開了一種基于學者科研成果挖掘的學者精準定位方法及裝置,其中,該方法包括:對學者科研成果p中文本信息進行抽取以獲取關鍵信息,并構建結構化信息;根據關鍵信息和結構化信息對學者科研成果p中具有地理指向性的隱含信息進行挖掘,以構造學者科研成果p相關結構化的隱含信息O;對結構化信息根據定位信息產生影響的重要程度進行結構化整理,并根據隱含信息O和不同類型地圖API特點,獲取最終結果R;根據最終結果R和矩陣U獲取A→R映射,并獲取學者科研成果中集合A的每個學者的地理位置信息,輸出學者科研成果p中所有作者的定位信息。該方法可以通過深度挖掘學者科研成果的文本信息,有效、準確地實現學者科研成果到學者地理位置信息的精確映射。
技術領域
本發明涉及定位技術領域,特別涉及一種基于學者科研成果挖掘的學者精準定位方法及裝置。
背景技術
學者科研成果的特定性質決定了其高可靠性,而學者的科研成果蘊含了學者的時空相關信息,根據學者的科研成果實現對學者的定位提供了可能性,根據復雜文本(如學者隸屬關系的信息)實現精準的定位一直以來是一個難題,已有的多種方法在實現精準定位上出現多方面的不一致。
學者的科研成果具有真實性、準確性、非匿名性、嚴謹等一系列的特點,因此,其信息具有相當高的可靠性,學者的科研成果蘊含了學者在特定時間、特定地點、從事特定方向的科研活動信息。就一般的論文、專利等科研成果來講,會包含學者的姓名、所在單位、時間和研究的內容等基本信息。其中,對學者科研論文信息進行抽取等可以完成學者時間空間的關系的關聯,在此基礎上使用地圖API完成學者所屬單位和地理位置信息的映射即可實現學者的定位。但是,由于學者科研成果文本信息的非結構化、寫法多樣等原因,導致抽取單一、語義明確的單位信息存在相當大的困難。使得所獲取的學者隸屬信息往往具有信息量相對較大、無用信息多、重點信息不突出、干擾信息多、信息缺失、歧義性大、多語言等一系列問題,都使得從學者的科研成果中實現對學者的精準定位變得困難。
傳統的地圖在實現字符串到地理位置信息的映射中做了很多工作,如谷歌實現了將來自用戶的、用于地圖搜索的輸入條目解析成用于指示輸入搜索條目中的位置信息的位置部分相關的工作。百度將用戶的輸入語句進行切詞,并在切詞結果中提取與該用戶需求相關的特定信息,然后再提取相應信息。奇虎根據用戶輸入的語句確定查詢對應的查詢樣式,然后根據查詢樣式,確定查詢的地圖相關度分數,再根據地圖相關分數,判斷是否顯示與查詢相關的電子地圖。騰訊通過統計興趣點數據庫內部地圖數據出現頻率及通過搜索引擎的查詢結果數進行排序,提高了地圖數據重要度的覆蓋率和準確率。微軟在多語言的查詢上進行了轉化和處理,提高了多語言環境下的處理準確率。
上述方法在一定程度上提高了用戶輸入查詢得到的結果的準確性,但是,針對學者科研成果中學者隸屬關系信息的特殊性沒有進行考慮,導致相當部分的數據無法獲得地理位置信息結果,獲得的部分結果出現了較大的偏差。使用國內著名的科技大數據挖掘服務平臺AMiner的論文數據進行測試,其中,結果顯示,直接使用地圖API對學者隸屬關系信息進行地理位置信息映射的查全率為50%,正確率低于80%。
由于不同的地圖在地址信息庫的建設的差異性存在,使得地址收錄的情況不一致、搜索關鍵字的權重不一樣、搜索結果的順序不一樣等情況的出現。這使得在查詢同一字符串時出現的結果出現差異,例如,以查詢“西北大學”為例,分別調用百度地圖和谷歌地圖API,百度地圖定位結果為:{lng:108.9342237431768,lat:34.25373435757479},谷歌地圖定位結果為:{lat:42.0564594,lng:-87.67526699999999},其中,兩者一個在中國境內,一個在美國境內,如果可以從論文中抽取出學者所在國別信息即可實現信息的正確化處理。
發明內容
本發明旨在至少在一定程度上解決相關技術中的技術問題之一。
為此,本發明的一個目的在于提出一種基于學者科研成果挖掘的學者精準定位方法,該方法可以有效、準確地實現學者科研成果到學者地理位置信息的精確映射。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清華大學,未經清華大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811149733.6/2.html,轉載請聲明來源鉆瓜專利網。





