[發明專利]一種ICD編碼數據處理方法、系統、存儲介質及設備有效
| 申請號: | 202011521635.8 | 申請日: | 2020-12-21 |
| 公開(公告)號: | CN112635001B | 公開(公告)日: | 2023-04-07 |
| 發明(設計)人: | 何彬彬;吳軍;高希余;樊昭磊;張伯政;桑波;何云威 | 申請(專利權)人: | 山東眾陽健康科技集團有限公司 |
| 主分類號: | G16H10/00 | 分類號: | G16H10/00;G06F40/126;G06N3/084 |
| 代理公司: | 濟南圣達知識產權代理有限公司 37221 | 代理人: | 張慶騫 |
| 地址: | 250000 山東省濟南市高*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 icd 編碼 數據處理 方法 系統 存儲 介質 設備 | ||
本發明屬于數據處理領域,提供了一種ICD編碼數據處理方法、系統、存儲介質及設備。其中,ICD編碼數據處理方法包括獲取醫療過程信息;將醫療過程信息輸入至ICD編碼預測模型中,輸出ICD編碼預測結果;所述ICD編碼預測結果采用張量表示,該張量中的值的數量與ICD中編碼的數量一致,張量中每個值表示其對應ICD中編碼的概率值;其中,ICD編碼預測模型使用損失函數loss進行優化直至到達預設目標,所述損失函數loss由ICD編碼預測結果對應的張量構建且具有三角函數、二次函數以及指數函數的性質。
技術領域
本發明屬于數據處理領域,尤其涉及一種ICD編碼數據處理方法、系統、存儲介質及設備。
背景技術
本部分的陳述僅僅是提供了與本發明相關的背景技術信息,不必然構成在先技術。
隨著當今ICD-10編碼在醫療系統中的推廣及應用,各級醫療結構都積累了大量的經過了編碼的醫療數據,但是由于當前編碼員人力緊缺,人員素質參差不齊,數據中往往混雜著一部分錯誤編碼的醫療數據。在使用深度學習技術對這些編碼后的混雜著一部分錯誤編碼的醫療數據進行處理的過程中,發明人發現,由于使用的交叉熵損失函數其設計初衷是假設所有的數據樣本均為正確樣本,沒有考慮到數據中錯誤樣本的問題,會在深度學習模型中傳播大量的錯誤梯度,從而影響診斷編碼結果。
發明內容
為了解決上述背景技術中存在的至少一項技術問題,本發明提供一種ICD編碼數據處理方法、系統、存儲介質及設備,其能夠使得模型對于邊界樣本的過學習現象得到抑制,提高ICD編碼數據輸出結果的準確性。
為了實現上述目的,本發明采用如下技術方案:
本發明的第一個方面提供一種ICD編碼數據處理方法。
一種ICD編碼數據處理方法,包括:
獲取醫療過程信息;
將醫療過程信息輸入至ICD編碼預測模型中,輸出ICD編碼預測結果;所述ICD編碼預測結果采用張量表示,該張量中的值的數量與ICD中編碼的數量一致,張量中每個值表示其對應ICD中編碼的概率值;
其中,ICD編碼預測模型使用損失函數loss進行優化直至到達預設目標,所述損失函數loss由ICD編碼預測結果對應的張量構建且具有三角函數、二次函數以及指數函數的性質。
作為一種實施方式,損失函數loss為:
進行優化;
其中,P為ICD編碼預測結果對應的張量;L為表示主診斷編碼結果的one-hot標簽,其與張量P的維度相同;β為邊界損失權重;γ為錯誤樣本權重。
上述技術方案的優點在于:該損失函數具有三角函數、二次函數以及指數函數的性質,控制了錯誤的ICD編碼樣本對于神經網絡訓練過程中的形成的錯誤梯度的干擾規模,而且提供了對分類邊界附近的邊界樣本的權重控制項,使得模型對于邊界樣本的過學習現象能夠得到抑制,繼而提升了模型的訓練效果,最終提高了ICD編碼預測結果的準確性。
作為一種實施方式,邊界損失權重β及錯誤樣本權重γ均為大于0的數值。
其中,邊界損失權重β可以按照需求調整,用于控制分類邊界附近的樣本損失權重;錯誤樣本權重γ可以按照需求調整,用于控制錯誤樣本的損失權重。
作為一種實施方式,ICD編碼預測結果對應的張量中最大的值對應的ICD編碼就是患者的主診斷編碼結果。
上述技術方案的優點在于:利用張量表示ICD編碼預測結果,張量中的值的數量與ICD中編碼的數量一致,張量中每個值表示其對應ICD中編碼的概率值,將醫療過程信息所對應的ICD中編碼的預測結果進行了量化,根據張量中最大的值對應的ICD編碼確定為患者的主診斷編碼結果,提高了主診斷編碼結果的準確性。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山東眾陽健康科技集團有限公司,未經山東眾陽健康科技集團有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011521635.8/2.html,轉載請聲明來源鉆瓜專利網。





