[發明專利]國際疾病分類編碼推薦方法、系統及相應設備和存儲介質有效
| 申請號: | 202010854420.1 | 申請日: | 2020-08-24 |
| 公開(公告)號: | CN111814463B | 公開(公告)日: | 2020-12-15 |
| 發明(設計)人: | 李文斌 | 申請(專利權)人: | 望海康信(北京)科技股份公司 |
| 主分類號: | G06F40/284 | 分類號: | G06F40/284;G06F40/30;G16H40/20 |
| 代理公司: | 北京金闕華進專利事務所(普通合伙) 11224 | 代理人: | 陳建春 |
| 地址: | 100176 北京市大興區經濟技*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 國際 疾病 分類 編碼 推薦 方法 系統 相應 設備 存儲 介質 | ||
本申請公開了國際疾病分類編碼推薦方法、系統及相應設備和存儲介質,其中所述方法包括:將要進行ICD編碼推薦的ICD名稱文本到預先形成的實體字典中映射相應的實體;將映射的實體轉換為多維詞向量;將多維詞向量和ICD名稱文本輸入到經訓練的深度學習模型;將深度學習模型的輸出中概率最高的前m個ICD亞目編碼作為推薦的ICD亞目編碼;其中,實體字典通過下述處理形成:對ICD編碼訓練數據集中的ICD名稱文本進行預處理,生成ICD詞庫;用知識圖譜工具對ICD詞庫進行預設維度的實體標注;將標注后的ICD詞庫整理成數據源文件;加載數據源文件到長短期記憶神經網絡模型進行訓練,輸出為實體字典。本發明使能為非標準ICD名稱自動智能推薦相應的標準化的ICD編碼,準確率和可靠性高。
技術領域
本申請涉及電數字數據處理領域,尤其涉及國際疾病分類編碼推薦方法、系統及相應設備和存儲介質。
背景技術
ICD編碼的標準化和準確性十分重要。然而,傳統輔助編碼工具已經存在了多年,但對智能實現的方式還停留在比較淺的層面上。現有的編碼工具大多基于文本,在關鍵字基礎上做可能的提示,引導編碼人員一步步操作得出最終編碼。傳統輔助編碼的核心是字符串搜索、串匹配。由于錄入文本時命名習慣不同、錄入時間有限等原因,錄入的名稱常常和標準的ICD命名不同。名稱的標準化和標準化編碼工作是由編碼員來完成的。但是,受制于不同編碼員工作年限、經驗、人員素質、對標準的解讀、對編碼字典龐大內容的把握程度以及編碼員人員編制的限制,甚至同一單位不同編碼員之間、同一編碼員在不同時期的編碼也存在差異。此外,編碼員每天可標準化處理的編碼數量很有限,而且很可能存在誤判的情況。因而,如何為非標準ICD名稱(包括診斷名稱和手術名稱)進行標準化編碼推薦是急需解決的問題。
發明內容
本發明提供一種國際疾病分類編碼推薦方法、系統及相應設備和存儲介質,其使能可靠、準確地為非標準ICD名稱自動智能推薦相應的標準化的ICD編碼。
在本發明的第一方面,提供一種國際疾病分類編碼推薦方法,包括:
將要進行國際疾病分類ICD編碼推薦的ICD名稱文本到預先形成的實體字典中映射相應的實體;
將映射的實體轉換為多維詞向量;
將所述多維詞向量和所述ICD名稱文本輸入到經訓練的深度學習模型;
將深度學習模型的輸出中概率最高的前m個ICD亞目編碼作為對所述ICD名稱文本推薦的ICD亞目編碼,m≥1;
其中,所述實體字典通過下述處理形成:
- 通過中文分詞器對ICD編碼訓練數據集中的ICD名稱文本進行至少包括分詞的預處理,生成ICD詞庫;
- 用知識圖譜工具對ICD詞庫進行預設維度的實體標注;
- 將標注后的ICD詞庫整理成數據源文件;
- 加載數據源文件到長短期記憶神經網絡模型進行訓練,輸出為實體字典。
在實施例中,所述預設維度包括操作、人體形態與結構、醫療器械、技術、入路和/或體位。
在實施例中,所述ICD編碼訓練數據集包括多個版本的ICD編碼標準庫和/或臨床ICD名稱和編碼數據集,所述深度學習模型的訓練包括:將所述ICD編碼訓練數據集作為深度學習模型的輸入進行初步訓練;將所述ICD編碼訓練數據集所含ICD名稱文本分別經實體標注、映射得到的多維詞向量輸入經初步訓練的深度學習模型進行進一步回歸訓練,使得深度學習模型輸出與ICD名稱對應的m個ICD亞目編碼。
在實施例中,所述預處理還包括下述之一或多個:根據擴展詞字典對專業醫學詞匯進行不分詞處理;根據同義詞字典將ICD名稱文本中的不同同義詞統一為一個標準詞或者將其它相應同義詞添加到ICD詞庫中;根據停用詞字典去除ICD名稱文本中的無意義字符;根據字符過濾器對字符進行轉義。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于望海康信(北京)科技股份公司,未經望海康信(北京)科技股份公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010854420.1/2.html,轉載請聲明來源鉆瓜專利網。





