[發明專利]跨語言的醫學知識圖譜構建方法、裝置與電子設備有效
| 申請號: | 201911044916.6 | 申請日: | 2019-10-30 |
| 公開(公告)號: | CN110990579B | 公開(公告)日: | 2022-12-02 |
| 發明(設計)人: | 張勇;邢春曉;盛明;李超;李欣 | 申請(專利權)人: | 清華大學;北京清華長庚醫院 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G16H50/70 |
| 代理公司: | 北京路浩知識產權代理有限公司 11002 | 代理人: | 王宇楊 |
| 地址: | 100084 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語言 醫學知識 圖譜 構建 方法 裝置 電子設備 | ||
1.一種跨語言的醫學知識圖譜構建方法,其特征在于,包括:
基于不同語言的醫療標準,通過將生成的跨語言且異構的數據集中的概念與關系進行融合,獲取跨語言的概念知識圖譜;
通過對來自醫院、開放數據集和社交數據集中所述不同語言的電子病歷進行實體、事件和關系的抽取與融合,獲取跨語言的實例知識圖譜;
將所述跨語言的概念知識圖譜與所述跨語言的實例知識圖譜相結合,形成跨語言的事實知識圖譜;
所述獲取跨語言的概念知識圖譜的步驟具體包括:
將所述不同語言的醫療標準在所述不同語言間進行互相映射,生成統一的跨語言醫療規則知識庫,所述跨語言醫療規則知識庫為跨語言且具有異構特征的數據集;
利用機器學習算法,對所述跨語言且異構的數據集中的概念和關系分別進行相互融合,生成所述跨語言的概念知識圖譜;
所述利用機器學習算法,對所述跨語言且異構的數據集中的概念和關系分別進行相互融合的步驟具體包括:
利用機器學習算法,并結合醫生的先驗知識,對所述跨語言且異構的數據集中的概念和關系分別進行相互融合;
所述利用機器學習算法,并結合醫生的先驗知識,對所述跨語言且異構的數據集中的概念和關系分別進行相互融合的步驟具體包括:
根據醫生的輸入設置,將實體關系模型中的列映射到資源描述框架模型中概念知識圖中的節點,并根據醫生輸入的常用醫學概念,以與所述跨語言醫療規則知識庫中的數據相同的格式,在所述跨語言醫療規則知識庫中添加新的醫學概念;
根據醫生輸入的同義詞,對所述跨語言醫療規則知識庫中的同義詞進行定義,并結合資源描述框架模型中概念知識圖中的所述節點、所述新的醫學概念和定義的同義詞,利用機器學習算法,對所述概念和所述關系分別進行相互融合。
2.根據權利要求1所述的跨語言的醫學知識圖譜構建方法,其特征在于,所述獲取跨語言的實例知識圖譜的步驟具體包括:
分別從醫院、所述開放數據集和所述社交數據集中收集所述不同語言的電子病歷,并對所述電子病歷分別進行實體提取、事件提取和關系提取,對應生成實體語料庫、事件語料庫和關系語料庫;
利用機器學習算法,對所述實體語料庫、所述事件語料庫和所述關系語料庫進行融合,生成所述跨語言的實例知識圖譜。
3.根據權利要求1所述的跨語言的醫學知識圖譜構建方法,其特征在于,
在所述生成所述跨語言的概念知識圖譜的步驟之后,還包括:利用機器學習算法,并結合醫生的先驗知識,在所述跨語言的概念知識圖譜中添加新的跨語言鏈接,或者,更新所述跨語言的概念知識圖譜中的跨語言鏈接。
4.根據權利要求3所述的跨語言的醫學知識圖譜構建方法,其特征在于,
所述利用機器學習算法,并結合醫生的先驗知識,在所述跨語言的概念知識圖譜中添加新的跨語言鏈接的步驟具體包括:
基于醫生輸入的醫學實例,利用機器學習算法,提取使用頻率超過設定限制的醫學概念和關系,并將提取的醫學概念和關系形成第一候選跨語言鏈接;
利用機器學習算法,從所述跨語言的概念知識圖譜中發掘第二候選跨語言鏈接,并對所述第一候選跨語言鏈接和所述第二候選跨語言鏈接進行篩選,獲取權重較高者作為所述新的跨語言鏈接,添加至所述跨語言的概念知識圖譜中。
5.根據權利要求1所述的跨語言的醫學知識圖譜構建方法,其特征在于,所述將所述不同語言的醫療標準在所述不同語言間進行互相映射的步驟具體包括:
分析所述醫療標準的詞匯特征,獲取所述醫療標準中各字符串分別對應的唯一代碼,并將所述唯一代碼映射到所述醫療標準的源詞匯表;
基于所述源詞匯表,獲取所述唯一代碼對應的源詞匯,并通過所述源詞匯映射所述醫療標準中包含的醫學概念和關系的唯一識別碼;
根據所述唯一識別碼,將所述不同語言的醫學概念和關系分別進行相互映射。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清華大學;北京清華長庚醫院,未經清華大學;北京清華長庚醫院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911044916.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:計算機化手表的物理手表指針
- 下一篇:資源處理方法及裝置





