[發明專利]實體消歧方法、裝置、存儲介質及計算機設備有效
| 申請號: | 202010418304.5 | 申請日: | 2020-05-18 |
| 公開(公告)號: | CN111680498B | 公開(公告)日: | 2023-04-07 |
| 發明(設計)人: | 劉萬增;翟曦;尹川 | 申請(專利權)人: | 國家基礎地理信息中心;北京建筑大學 |
| 主分類號: | G06F40/279 | 分類號: | G06F40/279;G06F40/226 |
| 代理公司: | 北京中強智尚知識產權代理有限公司 11448 | 代理人: | 黃耀威 |
| 地址: | 100830 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 實體 方法 裝置 存儲 介質 計算機 設備 | ||
本發明公開了一種實體消歧方法、裝置、存儲介質及計算機設備,涉及信息技術領域,主要目的在于通過在創建專家關系圖譜時,引入機構字段,并通過社交網絡關系分析技術對構建的待消歧子網進行處理,從而最大化實現知識圖譜中實體的消歧處理,減少后期消歧的工作量,提高知識圖譜構建的效率,節約人力資源。所述方法包括:根據合作關系模型以及預先創建的專家?機構關系表,構建專家關系圖譜;利用整體分析法對所述專家關系圖譜進行消歧處理。本發明適用于實體的消歧。
技術領域
本發明涉及信息技術領域,特別是涉及一種實體消歧方法、裝置、存儲介質及計算機設備。
背景技術
知識圖譜,在圖書情報界稱為知識域可視化或知識領域映射地圖,是顯示知識發展進程與結構關系的一系列各種不同的圖形,用可視化技術描述知識資源及其載體,挖掘、分析、構建、繪制和顯示知識及它們之間的相互聯系。而專家關系圖譜是通過對大量文獻的挖掘、抽取、集成等多種途徑獲取專家相關信息,對其進行標準化處理,使用相關算法建立專家、機構、相關研究等關系網絡。
目前,通常通過專家合作關系為基礎構建專家關系圖譜。然而,通過這種方法構建的專家關系圖譜存在大量的同名專家節點,例如專家名字為P的所有同名專家發表論文M篇,則需要進行處理的專家歧義對將達到C2m,后期人工進行消歧的工作量巨大,導致知識圖譜構建的效率降低,且耗費大量的人力資源。
發明內容
有鑒于此,本發明提供一種實體消歧方法、裝置、存儲介質及計算機設備,主要目的在于通過在創建專家關系圖譜時,引入機構字段,并通過社交網絡關系分析技術對構建的待消歧子網進行處理,從而最大化實現知識圖譜中實體的消歧處理,減少后期消歧的工作量,提高知識圖譜構建的效率,節約人力資源。
依據本發明一個方面,提供了一種實體消歧的方法,包括:
根據合作關系模型以及預先創建的專家-機構關系表,構建專家關系圖譜;
利用整體分析法對所述專家關系圖譜進行消歧處理。
進一步地,所述根據合作關系模型以及預先創建的專家-機構關系表,構建專家關系圖譜,包括:
提取所述專家-機構關系表中各實體字段信息和關系信息;
將所述實體字段信息添加至所述合作關系模型的實體集合中;
將所述關系信息添加至所述合作關系模型的關系集合中,以構建所述專家關系圖譜。
進一步地,所述利用整體分析法對所述專家關系圖譜進行消歧處理,包括:
根據選取的待消歧專家節點構建待消歧子網;
利用社交網絡分析技術對所述待消歧子網進行消歧處理。
進一步地,所述預先創建專家-機構關系表,包括:
根據獲取的專家信息與機構信息,判斷所述專家與機構是否為多對多的對應關系;
若否,則直接提取所述專家與機構的對應關系,并保存至所述專家-機構關系表;
若是,則只提取第一專家與第一機構的對應關系,并保存至所述專家-機構關系表。
進一步地,所述利用整體分析法對所述專家關系圖譜進行消歧處理之前,所述方法還包括:
基于相似度聚類算法對獲取的待消歧實體進行消歧處理。
進一步地,所述構建專家關系圖譜,包括:
利用gephi工具、所述合作關系模型以及所述預先創建的專家-機構關系表,生成專家關系圖譜。
依據本發明二個方面,提供了一種實體消歧裝置,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國家基礎地理信息中心;北京建筑大學,未經國家基礎地理信息中心;北京建筑大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010418304.5/2.html,轉載請聲明來源鉆瓜專利網。





