[發明專利]一種疾病知識圖譜構建方法和平臺系統、設備、存儲介質在審
| 申請號: | 201811205974.8 | 申請日: | 2018-10-17 |
| 公開(公告)號: | CN109271530A | 公開(公告)日: | 2019-01-25 |
| 發明(設計)人: | 蔣小云 | 申請(專利權)人: | 長沙瀚云信息科技有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06N5/02;G16H70/20 |
| 代理公司: | 長沙心智力知識產權代理事務所(普通合伙) 43233 | 代理人: | 謝如意 |
| 地址: | 410006 湖南省長沙市高*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 疾病知識 存儲介質 圖譜構建 圖譜 知識庫 快速構建 平臺系統 信息抽取 知識表達 知識加工 知識融合 質量評估 歧義 融合 數據源 臺系統 多源 整合 抽取 數據庫 標準化 規范化 加工 矛盾 學習 | ||
1.一種疾病知識圖譜構建方法,其特征在于,包括以下步驟:
A、信息抽取:從多源數據庫中提取或學習實體、屬性以及實體間的相互關系,形成本體化的知識表達;
B、知識融合:對知識進行整合,以消除矛盾和歧義;
C、知識加工:對于經過融合的知識,經過質量評估之后,加入到知識庫中。
2.根據權利要求1所述的一種疾病知識圖譜構建方法,其特征在于,步驟C之后還包括:D、知識圖譜的更新。
3.根據1所述的一種疾病知識圖譜構建方法,其特征在于,步驟A中所述的多源數據庫為開放鏈接數據庫和百科,實體的提取步驟為:
A101、實體學習;
A102、實體對齊學習;
A103、上下位關系學習和整合;進一步地,
步驟A中,屬性的提取步驟為:
A201、從開放鏈接數據集中獲取實體的屬性;
A202、從在線百科中學習實體的屬性,并對實體屬性進行往上規約從而生成概念的屬性。
4.根據1所述的一種疾病知識圖譜構建方法,其特征在于,步驟A中,還包括規則和公理的學習,所述的規則和公理的學習由用戶針對領域和應用場景添加相應的規則和公理;優選地,步驟A還包括學習過程中的沖突解決,所述的沖突解決包括沖突檢測和沖突解決方法。
5.根據權利要求3所述的一種疾病知識圖譜構建方法,其特征在于,A102、實體對齊的學習方法為:先把從百科中學習到的實體中描述同一目標的內容進行合并,再把經過合并后的結果實體集與從開放鏈接數據中抽取的實體進行合并;優選地,步驟A103上下位關系學習和整合包括:從開放鏈接數據集中抽取上下位關系、從百科中抽取上下位關系、基于CRF的開放上下位關系學習和分類樹整合;優選地,步驟D中所述知識圖譜的更新包括數據模式層的更新和數據層的更新。
6.根據權利要求7所述的一種疾病知識圖譜構建方法,其特征在于,所述從百科中學習到的實體中描述同一目標的內容進行合并包括:基于百科結構化數據的百科實體對齊方法、基于自監督的百科實體對齊方法、基于語言學模式的方法和基于CRF的開放同義關系學習;進一步地,所述基于自監督的百科實體對齊方法包括以下步驟:選擇候選實體,對每個候選實體進行特征選取,自動生成訓練語料,語料構建完成后,訓練模型,訓練完成后,采用支持向量機進行判別,對目標數據修訂本進行預測,目標數據集合的格式和訓練文件的格式一致,使用命令svmpredict完成。
7.根據權利要求6所述的一種疾病知識圖譜構建方法,其特征在于,所述的沖突檢測的方法包括概念與實體的區分,上下位關系中的沖突和單值型屬性沖突;優選地,所述的沖突解決方法包括一種是基于數據源可靠性的方法,第二種是基于支持因素數目的方法,第三種則是基于人工解決的方法。
8.一種疾病知識圖譜平臺系統,其特征在于,根據權利要求1-13所述的一種疾病知識圖譜構建方法,包括信息抽取模塊,用于從多源數據庫中提取或學習實體、屬性以及實體間的相互關系,形成本體化的知識表達;知識融合模塊:用于對知識進行整合,以消除矛盾和歧義;知識加工模塊:用于對于經過融合的知識,經過質量評估之后,加入到知識庫中;優選地,還包括知識圖譜的更新模塊,用于更新知識圖譜的數據模式層和數據層。
9.一種設備,其特征在于,所述設備包括:
一個或多個處理器;
存儲器,用于存儲一個或多個程序,
當所述一個或多個程序被所述一個或多個處理器執行時,使得所述一個或多個處理器執行如權利要求1-7中任一項所述的方法。
10.一種存儲有計算機程序的存儲介質,其特征在于,該程序被處理器執行時實現如權利要求1-7中任一項所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于長沙瀚云信息科技有限公司,未經長沙瀚云信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811205974.8/1.html,轉載請聲明來源鉆瓜專利網。





