[發明專利]一種基于中文電子病歷知識圖譜的實體對齊方法在審
| 申請號: | 202210413638.2 | 申請日: | 2022-04-15 |
| 公開(公告)號: | CN114722216A | 公開(公告)日: | 2022-07-08 |
| 發明(設計)人: | 李麗雙;董姜媛 | 申請(專利權)人: | 大連理工大學 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G16H10/60;G06N5/02;G06N3/04;G06F40/295;G06F16/28;G06K9/62 |
| 代理公司: | 大連星河彩舟專利代理事務所(普通合伙) 21263 | 代理人: | 陳玲玉;楊陽 |
| 地址: | 116024 遼*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 中文 電子 病歷 知識 圖譜 實體 對齊 方法 | ||
本發明提出一種基于中文電子病歷知識圖譜的實體對齊方法。該方法包括:構建訓練集和測試集,在異構醫學知識圖譜上構建用于實體對齊的訓練集和測試集;利用規則對醫學知識圖譜進行推理,補全缺失的關系,緩解醫學知識圖譜之間的結構異質性;構建基于門控機制的雙視角圖神經網絡模型,旨在對異構醫療知識圖譜進行對齊與融合,在兼顧準確率和人工成本的基礎上,Hits@5的準確率高達85.4%,有效的整合現有的醫療資源,推動智慧醫療的發展。
技術領域
本發明屬于自然語言處理領域,涉及一種中文電子病歷(Electronic MedicalRecord,EMR)知識圖譜(Knowledge Graph,KG)構建中的實體對齊方法,具體是指一種基于神經網絡以及門控機制的醫學知識圖譜對齊方法。
背景技術
中文電子病歷是信息化醫療健康服務的產物之一,它包含著大量的醫學事實,隨著國內電子病歷的大量積累,利用自然語言處理技術從大量電子病歷中自動化獲取、整合有效的醫療信息具有重要意義。構建電子病歷相關的知識圖譜是最有效的展示和利用電子病歷中醫療信息的方法之一。知識圖譜是一種知識表示形式,它能將信息要素結構化、規范化并以圖的形式清晰展示。基于電子病歷的知識圖譜是一種垂直領域知識圖譜,它有利于建立科學的智慧醫療知識庫和知識網絡。然而,由于知識來源和構建目的不同,不同知識圖譜之間出現知識重疊和互補現象,尤其是在醫學知識圖譜中,這種現象普遍存在。通過知識融合技術建立一個大規模的醫學知識圖譜有助于提高數據質量從而促進智能醫療的發展。知識融合中最關鍵的技術是實體對齊,其目標是判別不同知識圖譜中的兩個實體是否指向現實世界中的同一事物。
在通用領域中,早期的實體對齊使用相似性度量的方法,通過計算兩個實體的字符串相似性和結構相似性來判斷它們是否對齊。然而,此類方法通常根據手動設計的規則對齊實體,使得它們非常復雜且難以實現。后來,隨著知識圖譜表示學習的發展,越來越多的研究人員開始使用知識圖譜表示學習來代替符號形式主義來解決問題。最著名的知識圖譜表示學習模型是一組基于翻譯的模型,其中最經典的一個模型是TransE。雖然基于翻譯的方法不依賴手動構建的規則,然而,基于翻譯的模型只能獲取實體的一階鄰域信息,因此學習到的實體嵌入只能表示實體的局部特征,不能充分利用知識圖譜的結構信息。
近年來隨著圖神經網絡的發展,一些研究使用圖神經網絡建模知識圖譜的結構,用鄰居實體增強實體嵌入,即利用圖卷積遞歸聚合鄰居實體的表示來學習中心實體表示。因此,實體鄰域結構越相似,基于圖神經網絡的模型為中心實體學習到的表示越接近。然而,由于知識來源和構建目的不同,知識圖譜之間普遍存在結構異質性,嚴重影響了此類模型的發展。Wang等人(Cross-lingual knowledge graph alignment via graphconvolutional networks.In:Proceedings of the 2018 Conference on EmpiricalMethods in Natural Language Processing,pp.349–357(2018))首次嘗試使用圖卷積網絡進行實體對齊。Ye等人(A vectorized relational graph convolutional network formulti-relational network alignment.In:IJCAI,pp.4135–4141(2019))在卷積過程中引入TransE模型的翻譯特性,將實體的不同鄰居加入對應的關系向量進行合并表示。然而,他們都沒有考慮知識圖譜異構性對實體對齊產生的影響。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于大連理工大學,未經大連理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210413638.2/2.html,轉載請聲明來源鉆瓜專利網。





