[發明專利]一種醫療否定術語的檢出方法及系統有效
| 申請號: | 201710625143.5 | 申請日: | 2017-07-27 |
| 公開(公告)號: | CN110019641B | 公開(公告)日: | 2023-09-08 |
| 發明(設計)人: | 康亮環;王琦;陳中陽 | 申請(專利權)人: | 北大醫療信息技術有限公司 |
| 主分類號: | G06F16/31 | 分類號: | G06F16/31;G06F16/33;G06F40/284;G16H50/70 |
| 代理公司: | 北京友聯知識產權代理事務所(普通合伙) 11343 | 代理人: | 尚志峰;汪海屏 |
| 地址: | 100080 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 醫療 否定 術語 檢出 方法 系統 | ||
本發明提出了一種醫療否定術語的檢出方法及系統,醫療否定術語的檢出方法包括:獲取電子病歷文本以及搜索引擎對其進行索引得出的索引分詞結果;根據電子病歷文本,對索引分詞結果進行處理,以得到新索引分詞序列;在新索引分詞序列中提取醫療否定術語;對醫療否定術語進行標記,以還原并輸出新索引分詞結果。本發明能夠在電子病歷搜索引擎得到的索引分詞結果中,檢索出具有否定意義的醫療術語,并將其轉化為帶有否定標記的詞,最終得到一個新索引分詞結果,實現了電子病歷搜索引擎能夠從語義層面準確區分出電子病歷文本描述中明確否認的醫療問題,使醫療否定術語的檢出結果符合用戶的要求,提高了醫療否定術語的檢出的合理性。
技術領域
本發明涉及醫療技術領域,具體而言,涉及一種醫療否定術語的檢出方法及系統。
背景技術
電子病歷是患者在醫療機構就診時產生的醫療記錄。電子病歷數據的形式主要有表格、自由文本、圖像這三種。自由文本主要有出院小結、病程記錄、主訴、現病史、病歷小結、醫患溝通記錄、醫患協議、超聲報告等,它們都是以非結構化數據的形式呈現。隨著醫院信息化的發展,醫院已經積累了大量這些非結構化的電子病歷數據,其中蘊含了大量寶貴的醫學和臨床信息。如何從這些非結構化電子病歷中提取信息已經變得越來越迫切,并逐漸成為醫院信息化工作的一個重要部分。
在電子病歷中,術語表達的意思并非都是肯定的,為了建立概念準確的電子病歷索引,需要進行醫療否定術語的檢出。現有的中文電子病歷方面的研究都是基于規則和模式匹配,因此其制定的規則和算法依賴于待處理的電子病歷文本形式。這些方法面向的都是普通電子病歷文本,但搜索引擎中的電子病歷文本形式與普通電子病歷文本有所不同,主要的區別有兩點:索引分詞對長詞進行全切分(把所有可能切分結果列出,分詞之間可能有重疊);索引分詞會過濾詞(包括停用詞、標點符號等)。搜索引擎先將普通文本轉化為索引分詞,再為每個分詞建立索引。例如,普通電子病歷文本為“否認糖尿病史”,現有方法通過預定義規則進行匹配,得到否定術語為“糖尿病史”,但這句話在電子病歷索引中的一種可能文本形式為“否認糖尿病史糖尿病糖尿病史”(利用常用的索引分詞工具IK?Analyzer2012FF得到的索引分詞結果),如果直接利用現有方法,得到的否定術語包括“糖尿病史”“糖尿病”“糖尿”“病史”,顯然后三種都不符合要求。因此現有否定詞檢出技術不能直接應用在搜索引擎的索引中。
發明內容
本發明旨在至少解決現有技術或相關技術中存在的技術問題之一。
為此,本發明的一個方面在于提出了一種醫療否定術語的檢出方法。
本發明的另一個方面在于提出了一種醫療否定術語的檢出系統。
有鑒于此,根據本發明的一個方面,提出了醫療否定術語的檢出方法,包括:獲取電子病歷文本以及搜索引擎對其進行索引得出的索引分詞結果;根據電子病歷文本,對索引分詞結果進行處理,以得到新索引分詞序列;在新索引分詞序列中提取醫療否定術語;對醫療否定術語進行標記,以還原并輸出新索引分詞結果。
本發明提供的醫療否定術語的檢出方法,依據電子病歷文本對搜索引擎對其索引得到的索引分詞結果處理,得出一個新索引分詞序列,再進一步從新索引分詞序列中提取出醫療否定術語,并提取的醫療否定術語轉化為帶有否定標記的詞,最終還原并輸出一個新索引分詞結果。利用該新索引分詞結果,搜索引擎能很方便的提供及識別具有否定語義的醫療術語,能夠從語義層面準確區分出電子病歷文本描述中明確否認的醫療問題(如疾病、癥狀、檢查檢驗結果等),使醫療否定術語的檢出結果符合用戶的要求,提高了醫療否定術語的檢出的合理性。
根據本發明的上述醫療否定術語的檢出方法,還可以具有以下技術特征:
在上述技術方案中,優選地,在新索引分詞序列中提取醫療否定術語之前,還包括:將電子病歷文本中的關鍵詞整理為關鍵詞詞典;根據新索引分詞序列及關鍵詞詞典創建醫療特征模板;分析索引分詞結果中醫療否定術語表述特點,以歸納出索引分詞結果中醫療否定術語的匹配規則。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北大醫療信息技術有限公司,未經北大醫療信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710625143.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:涉密文件檢查方法及裝置
- 下一篇:一種相似文本檢測方法及裝置





