[發明專利]基于節點相似度的醫學術語歸一化方法及系統在審
| 申請號: | 202211259564.8 | 申請日: | 2022-10-14 |
| 公開(公告)號: | CN115545017A | 公開(公告)日: | 2022-12-30 |
| 發明(設計)人: | 李宇萱;李向陽 | 申請(專利權)人: | 山東浪潮智慧醫療科技有限公司;山東健康醫療大數據有限公司 |
| 主分類號: | G06F40/279 | 分類號: | G06F40/279;G06F40/237;G06N5/02 |
| 代理公司: | 濟南信達專利事務所有限公司 37100 | 代理人: | 潘悅梅 |
| 地址: | 250100 山東省濟南市中國(山東)自由貿易試驗*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 節點 相似 醫學 術語 歸一化 方法 系統 | ||
1.一種基于節點相似度的醫學術語歸一化方法,其特征在于,包括如下步驟:
獲取醫學術語歸一詞作為實體歸一詞,并對每個實體歸一詞標注實體類型;
對于每個實體歸一詞,獲取所述實體歸一詞的所有實體屬性以及每個實體屬性對應的屬性類型,將所述實體歸一詞以及對應的實體屬性、屬性類型、實體類型以及實體歸一詞與實體屬性之間關系類型作為一個詞組,將每個實體歸一詞對應的詞組作為一條知識構建知識庫;
對于要進行歸一化的目標實體,獲取所述目標實體對應的實體屬性以及目標實體和與其對應實體屬性之間關系類型,計算所述目標實體的實體屬性與知識庫中各個歸一詞實體的實體屬性之間的節點相似度;
選取與目標實體屬性的節點相似度大于閾值的歸一化詞實體作為匹配歸一化實體,如果所述匹配歸一化實體為多個,通過人工判定的方式選擇一個實體歸一詞作為所述目標實體對應的歸一詞實體。
2.根據權利要求1所述的基于節點相似度的醫學術語歸一化方法,其特征在于,如果目標實體對應的實體類型已知,從知識庫中篩選出與所述目標實體同一個實體類型的實體歸一詞,基于篩選出的實體歸一詞、計算目標實體的實體屬性與所述實體歸一詞的實體屬性之間的節點相似度。
3.根據權利要求1所述的基于節點相似度的醫學術語歸一化方法,其特征在于,如果實體歸一詞對應實體屬性的數量多于閾值,基于實體歸一詞和與其對應實體屬性之間關系類型、選取與目標實體和與其對應實體屬性之間關系類型相同的實體屬性,基于選取實體屬性、計算目標實體的實體屬性與實體歸一詞的實體屬性之間的節點相似度;
如果目標實體對應實體屬性的數量多于閾值,選取在知識庫中占比為前列的N個實體屬性作為目標實體的實體屬性,基于選取的實體屬性、計算目標實體的實體屬性與所述實體歸一詞的實體屬性之間的節點相似度。
4.根據權利要求1所述的基于節點相似度的醫學術語歸一化方法,其特征在于,如果目標實體的實體屬性與知識庫中每個歸一詞實體的實體屬性之間的節點相似度均為零,判定知識庫中不存在目標實體的歸一詞,對所述目標實體進行人工校驗后,將所述目標實體以及對應的實體類型、實體屬性、屬性類別以及目標實體和與其對應實體屬性之間關系類型作為一個詞組,將所述詞組作為一條新的知識更新至知識庫。
5.根據權利要求1所述的基于節點相似度的醫學術語歸一化方法,其特征在于,通過如下方法計算所述目標實體的實體屬性與知識庫中各個歸一詞實體的實體屬性之間的節點相似度:基于實體屬性的屬性值以及實體屬性的屬性類型,將目標實體的實體屬性與實體歸一詞的實體屬性逐個進行匹配,將屬性值與屬性類型均相同的實體屬性作為匹配的實體屬性;
對應的,節點相似度計算公式為:
Ji=S0∩Si/S0∪Si=S0∩Si/(S0+Si-S0∩Si)
其中,Ji表示目標實體與第i個歸一詞實體的節點相似度值,S0表示目標實體的實體屬性集合,Si表示第i個歸一詞實體的實體屬性集合。
6.一種基于節點相似度的醫學術語歸一化系統,其特征在于,用于通過如權利要求1-5任一項所述的基于節點相似度的醫學術語歸一化方法對目標實體進行歸一化,所述系統包括:
數據采集模塊,所述數據采集模塊用于獲取醫學術語歸一詞作為實體歸一詞,并對每個實體歸一詞標注實體類型;
知識庫構建模塊,對于每個實體歸一詞,獲取所述實體歸一詞的所有實體屬性以及每個實體屬性對應的屬性類型,將所述實體歸一詞以及對應的實體屬性、屬性類型、實體類型以及實體歸一詞與實體屬性之間關系類型作為一個詞組,將每個實體歸一詞對應的詞組作為一條知識構建知識庫;
歸一化實體匹配模塊,對于要進行歸一化的目標實體,所述歸一化實體匹配模塊用于獲取所述目標實體對應的實體屬性以及目標實體和與其對應實體屬性之間關系類型,計算所述目標實體的實體屬性與知識庫中各個歸一詞實體的實體屬性之間的節點相似度;
歸一化實體選擇模塊,所述歸一化實體選擇模塊用于選取與目標實體屬性的節點相似度大于閾值的歸一化詞實體作為匹配歸一化實體,如果所述匹配歸一化實體為多個,通過人工判定的方式選擇一個實體歸一詞作為所述目標實體對應的歸一詞實體。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山東浪潮智慧醫療科技有限公司;山東健康醫療大數據有限公司,未經山東浪潮智慧醫療科技有限公司;山東健康醫療大數據有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211259564.8/1.html,轉載請聲明來源鉆瓜專利網。





