[發明專利]一種多源同名專家消歧方法在審
| 申請號: | 202011082199.9 | 申請日: | 2020-10-12 |
| 公開(公告)號: | CN112183100A | 公開(公告)日: | 2021-01-05 |
| 發明(設計)人: | 李林;李成中;譚祥;巴宗岳 | 申請(專利權)人: | 浪潮天元通信信息系統有限公司 |
| 主分類號: | G06F40/295 | 分類號: | G06F40/295;G06F40/30;G06F16/36 |
| 代理公司: | 濟南信達專利事務所有限公司 37100 | 代理人: | 陳婷婷 |
| 地址: | 250100 山東*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 同名 專家 方法 | ||
1.一種多源同名專家消歧方法,其特征在于,對來源于多個專家庫的專家數據進行清洗加工,進行專家姓名唯一性分析;
結合專家成果關聯及碰撞消歧處理,將包含專家實體定義的多源知識庫進行整合,對大量存在的專家重名現象進行實體消歧,以明確實體的正確指向,確定其語義,建立統一專家庫。
2.根據權利要求1所述的一種多源同名專家消歧方法,其特征在于,所述清洗加工包括專家數據屬性值確認,對于不符合常規邏輯和有明顯錯誤的專家屬性值進行置空。
3.根據權利要求1所述的一種多源同名專家消歧方法,其特征在于,對專家姓名唯一性分析過程如下:
若唯一,則將多源異名專家直接抽取入庫;
若不唯一,則根據專家成果關聯結果進行判斷,碰撞消歧處理后入庫。
4.根據權利要求3所述的一種多源同名專家消歧方法,其特征在于,建立專家與期刊論文關系庫,實現專家與期刊論文成果的關聯,進而根據專家成果關聯結果進行判斷專家姓名唯一性。
5.根據權利要求1或2或3所述的一種多源同名專家消歧方法,其特征在于,所述碰撞消歧處理采用三角無向性碰撞消歧矩陣規則相交融合:
建立碰撞消歧規則引擎,并基于三角無向性碰撞消歧矩陣對碰撞消歧規則進行相交融合。
6.根據權利要求5所述的一種多源同名專家消歧方法,其特征在于,根據專家姓名MD5值的首字母進行專家分組,每組查詢出姓名相同的專家,基于碰撞消歧規則進行數據判重,對重復數據進行融合。
7.根據權利要求6所述的一種多源同名專家消歧方法,其特征在于,基于所述相交融合結果,根據專家數據屬性值進行碰撞消歧處理,所述屬性值包括出生日期、手機號、文獻成果、簡介、研究領域和數據來源權威性。
8.根據權利要求1或2所述的一種多源同名專家消歧方法,其特征在于,所述多個專家庫為工程科技領域的多個專家數據庫;將碰撞消歧處理后的多源同名專家進行入庫,建立工程科技領域統一專家庫。
9.一種多源同名專家消歧裝置,其特征在于,包括:至少一個存儲器和至少一個處理器;
所述至少一個存儲器,用于存儲機器可讀程序;
所述至少一個處理器,用于調用所述機器可讀程序,執行權利要求1至8任一所述的方法。
10.計算機可讀介質,其特征在于,所述計算機可讀介質上存儲有計算機指令,所述計算機指令在被處理器執行時,使所述處理器執行權利要求1至8任一所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浪潮天元通信信息系統有限公司,未經浪潮天元通信信息系統有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011082199.9/1.html,轉載請聲明來源鉆瓜專利網。





