[發明專利]ICD編碼方法、裝置、電子設備和存儲介質有效
| 申請號: | 202011351677.1 | 申請日: | 2020-11-27 |
| 公開(公告)號: | CN112183026B | 公開(公告)日: | 2021-11-23 |
| 發明(設計)人: | 尤心心;劉喜恩;吳及 | 申請(專利權)人: | 北京惠及智醫科技有限公司 |
| 主分類號: | G06F40/126 | 分類號: | G06F40/126;G06F40/295;G06F40/30;G06N3/04 |
| 代理公司: | 北京路浩知識產權代理有限公司 11002 | 代理人: | 程琛 |
| 地址: | 102299 北京市昌平區科*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | icd 編碼 方法 裝置 電子設備 存儲 介質 | ||
本發明提供一種ICD編碼方法、裝置、電子設備和存儲介質,其中方法包括:確定待編碼的病歷文本對應的多個候選ICD編碼;基于所述病歷文本,以及每一候選ICD編碼的疾病知識文本,確定所述病歷文本對應的ICD編碼。本發明提供的方法、裝置、電子設備和存儲介質,在ICD編碼過程中結合了各個候選ICD編碼的疾病知識文本,使得ICD編碼在考慮病歷文本中涵蓋的信息的同時,得到各個候選ICD編碼對應疾病的診療知識作為支撐,在實現自動ICD編碼的同時避免了過擬合的問題,提高了ICD編碼的泛化性、準確性,保證了ICD編碼的及時性。
技術領域
本發明涉及自然語言處理技術領域,尤其涉及一種ICD編碼方法、裝置、電子設備和存儲介質。
背景技術
國際疾病分類(International Classification of Diseases,ICD)是世界衛生組織(World Health Organization,WHO)制定的國際統一疾病分類方法,也是衛生信息標準體系的重要組成部分。
由于ICD編碼與傳統的疾病診斷之間存在很大的差異性,通常需要專業的ICD編碼員應對該工作。然而編碼員需要在翻閱詳細厚重的病案信息后,才能給出正確的編碼,編碼效率極低。
發明內容
本發明提供一種ICD編碼方法、裝置、電子設備和存儲介質,用以解決現有技術中人工進行ICD編碼耗時耗力的缺陷。
本發明提供一種ICD編碼方法,包括:
確定待編碼的病歷文本對應的多個候選ICD編碼;
基于所述病歷文本,以及每一候選ICD編碼的疾病知識文本,確定所述病歷文本對應的ICD編碼。
根據本發明提供一種的ICD編碼方法,所述基于所述病歷文本,以及每一候選ICD編碼的疾病知識文本,確定所述病歷文本對應的ICD編碼,包括:
基于所述病歷文本與每一候選ICD編碼的疾病知識文本中分別包含分詞的分詞表示,確定所述病歷文本和每一疾病知識文本的語義特征;
基于所述病歷文本和每一疾病知識文本的語義特征,確定所述病歷文本對應的ICD編碼;
其中,所述分詞表示是基于樣本病歷文本中的所有分詞、每一ICD編碼的疾病知識文本中的所有分詞以及每一ICD編碼對應的疾病名詞之間的詞依賴性,以及每一疾病名詞對應ICD編碼之間的編碼關聯性確定的。
根據本發明提供一種的ICD編碼方法,所述分詞表示是基于如下步驟確定的:
基于樣本病歷文本中病案文本和診斷文本的所有分詞、每一ICD編碼的疾病知識文本的所有分詞以及每一ICD編碼對應的疾病名詞之間的詞共現信息,構建以分詞為節點的詞依賴關系圖;
基于每一ICD編碼之間的編碼關聯性,構建以疾病名詞為節點的編碼關系圖,所述編碼關聯性包括每一ICD編碼之間層級結構關系和/或每一ICD編碼對應的疾病名詞之間的語義相似關系;
確定所述詞依賴關系圖和所述編碼關系圖中各節點對應分詞的分詞表示。
根據本發明提供一種的ICD編碼方法,所述確定所述詞依賴關系圖和所述編碼關系圖中各節點對應分詞的分詞表示,包括:
對所述詞依賴關系圖和所述編碼關系圖進行圖內消息傳遞和圖間消息傳遞,得到所述詞依賴關系圖和所述編碼關系圖中各節點對應分詞的分詞表示。
根據本發明提供一種的ICD編碼方法,所述病歷文本的語義特征包括所述病歷文本中病案文本的語義特征和診斷文本的語義特征;
所述基于所述病歷文本和每一疾病知識文本的語義特征,確定所述病歷文本對應的ICD編碼,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京惠及智醫科技有限公司,未經北京惠及智醫科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011351677.1/2.html,轉載請聲明來源鉆瓜專利網。





