[發明專利]國際疾病分類編碼推薦方法、系統及相應設備和存儲介質有效
| 申請號: | 202010854420.1 | 申請日: | 2020-08-24 |
| 公開(公告)號: | CN111814463B | 公開(公告)日: | 2020-12-15 |
| 發明(設計)人: | 李文斌 | 申請(專利權)人: | 望海康信(北京)科技股份公司 |
| 主分類號: | G06F40/284 | 分類號: | G06F40/284;G06F40/30;G16H40/20 |
| 代理公司: | 北京金闕華進專利事務所(普通合伙) 11224 | 代理人: | 陳建春 |
| 地址: | 100176 北京市大興區經濟技*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 國際 疾病 分類 編碼 推薦 方法 系統 相應 設備 存儲 介質 | ||
1.一種國際疾病分類編碼推薦方法,其特征在于,所述方法包括:
將要進行國際疾病分類ICD編碼推薦的ICD名稱文本到預先形成的實體字典中映射相應的實體;
將映射的實體轉換為多維詞向量;
將所述多維詞向量和所述ICD名稱文本輸入到經訓練的深度學習模型;
將所述深度學習模型的輸出中概率最高的前m個ICD亞目編碼作為對所述ICD名稱文本推薦的ICD亞目編碼,m≥1;
其中,所述實體字典通過下述處理形成:
通過中文分詞器對ICD編碼訓練數據集中的ICD名稱文本進行至少包括分詞的預處理,生成ICD詞庫;
用知識圖譜工具對ICD詞庫進行預設維度的實體標注;
將標注后的ICD詞庫整理成數據源文件;
加載數據源文件到長短期記憶神經網絡模型進行訓練,輸出為實體字典。
2.在根據權利要求1所述的方法,其特征在于,所述預設維度包括操作、人體形態與結構、醫療器械、技術、入路和/或體位。
3.根據權利要求1所述的方法,其特征在于,所述ICD編碼訓練數據集包括多個版本的ICD編碼標準庫和/或包括臨床ICD名稱和編碼的數據集,所述深度學習模型的訓練包括:
將所述ICD編碼訓練數據集作為深度學習模型的輸入進行初步訓練;
將所述ICD編碼訓練數據集所含ICD名稱文本分別經實體標注、映射得到的多維詞向量輸入經初步訓練的深度學習模型進行進一步回歸訓練,使得深度學習模型輸出與ICD名稱對應的m個ICD亞目編碼。
4.根據權利要求1所述的方法,其特征在于,所述預處理還包括下述之一或多個:
根據擴展詞字典對專業醫學詞匯進行不分詞處理;
根據同義詞字典將ICD名稱文本中的不同同義詞統一為一個標準詞或者將其它相應同義詞添加到ICD詞庫中;
根據停用詞字典去除ICD名稱文本中的無意義字符;
根據字符過濾器對字符進行轉義。
5.根據權利要求1所述的方法,其特征在于,所述方法還包括:
確定所述m個ICD亞目編碼分別所屬的預設亞目類型;
確定所述m個ICD亞目編碼中其置信度高于相應類型的預設置信度閾值的n個ICD亞目編碼,n≤m;
基于包含擬使用的ICD編碼標準庫數據的索引庫,采用文本相似度算法從索引庫中所述n個ICD亞目編碼對應的ICD細目中確定與將要進行ICD編碼推薦的ICD名稱文本對應的一個ICD細目編碼。
6.根據權利要求5所述的方法,其特征在于,所述預設亞目類型按照臨床頻次分類為高頻、中頻和低頻三類,低頻、中頻和高頻亞目類型的置信度閾值依次遞增。
7.根據權利要求5所述的方法,其特征在于,所述文本相似度算法為BW25文本相似度算法。
8.一種國際疾病分類編碼推薦系統,其特征在于,所述系統包括:
映射模塊,用于將要進行國際疾病分類ICD編碼推薦的ICD名稱文本到預先形成的實體字典中映射相應的實體;
轉換模塊,用于將映射的實體轉換為多維詞向量;
輸入模塊,用于將所述多維詞向量和所述ICD名稱文本輸入到經訓練的深度學習模型;
推薦模塊,用于將所述深度學習模型的輸出中概率最高的前m個ICD亞目編碼作為對所述ICD名稱文本推薦的ICD亞目編碼,m≥1;
其中,所述實體字典通過下述處理形成:
通過中文分詞器對ICD編碼訓練數據集中的ICD名稱文本進行至少包括分詞的預處理,生成ICD詞庫;
用知識圖譜工具對ICD詞庫進行預設維度的實體標注;
將標注后的ICD詞庫整理成數據源文件;
加載數據源文件到長短期記憶神經網絡模型進行訓練,輸出為實體字典。
9.一種計算機設備,包括處理器、存儲器及存儲在所述存儲器上并可在所述處理器上運行的計算機程序,其中所述處理器執行所述計算機程序時實現根據權利要求1所述的方法的步驟。
10.一種計算機可讀存儲介質,其上存儲有計算機程序,所述計算機程序被處理器執行時實現根據權利要求1所述的方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于望海康信(北京)科技股份公司,未經望海康信(北京)科技股份公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010854420.1/1.html,轉載請聲明來源鉆瓜專利網。





