[發明專利]從電子病歷中提取結構化信息的方法、裝置及存儲介質有效
| 申請號: | 202011599792.0 | 申請日: | 2020-12-30 |
| 公開(公告)號: | CN112700830B | 公開(公告)日: | 2023-03-24 |
| 發明(設計)人: | 楊寶山 | 申請(專利權)人: | 醫渡云(北京)技術有限公司 |
| 主分類號: | G16H10/60 | 分類號: | G16H10/60;G06F40/242;G06F40/284 |
| 代理公司: | 北京樂知新創知識產權代理事務所(普通合伙) 11734 | 代理人: | 張立新 |
| 地址: | 100089 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 電子 病歷 提取 結構 信息 方法 裝置 存儲 介質 | ||
本發明公開了一種從電子病歷中提取結構化信息的方法、裝置及計算機可讀存儲介質,該方法包括根據現有醫學詞典或知識庫,從電子病歷中提取關鍵詞,其中包括現有醫學詞典或知識庫中已知的關鍵詞和未收錄在醫學詞典或知識庫中的未知的關鍵詞;對于其中未知的關鍵詞,可先確定出與未知的關鍵詞關系最為緊密的若干個章節,然后利用特定算法對上述若干個章節進行評分,并從若干個章節中選取一個超過閾值的章節作為該關鍵詞對應的章節。如此,即使現有醫學詞典或知識庫中所收錄的關鍵詞不夠,也可以通過上述方法確定未知關鍵詞和未知關鍵詞所對應的章節,從而獲取到足夠的結構化信息以用于后續的分析和統計等。
技術領域
本發明涉及自然語言處理技術領域,尤其涉及一種對電子病歷數據進行解析并從中提取結構化信息的方法、裝置及計算機可讀存儲介質。
背景技術
對電子病歷進行整理和分析,具有非常重要的意義,而關鍵詞的提取和所屬章節的確定更是重中之重。
但由于醫療信息數字化起步較晚,相應的醫學詞典和醫學知識庫建設還不盡完善,常常造成根據現有的醫學詞典和醫學知識庫無法準確識別出電子病歷中所包含的某些關鍵詞,或無法準確地確定關鍵詞所在的具體章節而造成信息遺漏或缺失。
發明內容
本發明實施例為了解決電子病歷中提取關鍵詞并確定關鍵詞所屬的章節時存在的上述問題,創造性地提供一種從電子病歷中提取結構化信息的方法、裝置及計算機可讀存儲介質。
根據本發明實施例的第一方面,提供了一種從電子病歷中提取結構化信息的方法,該方法包括:獲取待提取結構化信息的電子病歷,結構化信息包括關鍵詞和關鍵詞所屬的章節;從電子病歷中提取關鍵詞;從關鍵詞中確定出未知關鍵詞以及與每個未知關鍵詞關聯的K個章節,其中K為大于等于1的整數;對K個章節進行評分并將評分超過閾值的章節確定為相應的未知關鍵詞所屬的章節。
根據本發明實施例一實施方式,從關鍵詞中確定出未知關鍵詞以及與每個未知關鍵詞關聯的K個章節,包括:從關鍵詞中確定出未知關鍵詞;計算每個未知關鍵詞與已知關鍵詞的相似度,并根據相似度從大到小的排序確定出與未知關鍵詞最為相似的L個已知關鍵詞;獲取每個已知關鍵詞所屬的章節得到與相應的未知關鍵詞關聯的K個章節,其中K小于等于L。
根據本發明實施例一實施方式,對K個章節進行評分并將評分超過閾值的章節確定為相應的未知關鍵詞所屬的章節,包括:確定每個章節對應的關聯度;確定每個章節對應的相似度;根據所述關聯度和相似度,對K個章節進行評分并將評分超過閾值的章節確定為相應的未知關鍵詞所屬的章節。
根據本發明實施例一實施方式,確定每個章節對應的關聯度,包括:確定相應的未知關鍵詞的前序章節或后序章節;根據前序章節或后續章節以及預先建立的前后章節的關聯關系和關聯關系的概率,確定每個章節對應的關聯度。
根據本發明實施例一實施方式,確定相應的未知關鍵詞的前序章節或后序章節,包括:根據未知關鍵詞之前的已知關鍵詞確定前序章節,或根據未知關鍵詞之后的已知關鍵詞確定后序章節。
根據本發明實施例一實施方式,確定相應的未知關鍵詞的前序章節或后序章節,包括:根據第一未知關鍵詞的前序章節或后序章節確定第二未知關鍵詞的前序章節或后續章節。
根據本發明實施例一實施方式,在根據前序章節或后續章節以及預先建立的前后章節的關聯關系和關聯關系的概率之前,該方法還包括:根據章節相關的統計數據確定前后章節的關聯關系和關聯關系的概率。
根據本發明實施例一實施方式,對K個章節進行評分并將評分超過閾值的章節確定為相應的未知關鍵詞所屬的章節,包括:使用自然語言處理模型對K個章節進行端到端的評分并將評分超過閾值的章節確定為相應的未知關鍵詞所屬的章節。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于醫渡云(北京)技術有限公司,未經醫渡云(北京)技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011599792.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:廠房防污降載裝置
- 下一篇:一種發動機停缸控制方法和發動機





