[發明專利]疾病名稱對碼方法、裝置、計算機設備及存儲介質在審
| 申請號: | 202010340354.6 | 申請日: | 2020-04-26 |
| 公開(公告)號: | CN111695336A | 公開(公告)日: | 2020-09-22 |
| 發明(設計)人: | 金曉輝;阮曉雯;徐亮 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F40/216 | 分類號: | G06F40/216;G06F40/289;G06F16/2458;G06F16/28;G16H10/60 |
| 代理公司: | 深圳市世聯合知識產權代理有限公司 44385 | 代理人: | 汪琳琳 |
| 地址: | 518000 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 疾病 名稱 方法 裝置 計算機 設備 存儲 介質 | ||
1.一種疾病名稱對碼方法,其特征在于,包括下述步驟:
從電子病歷中獲取疾病名稱列表;
對所述疾病名稱列表中重復的疾病名稱進行去重處理,得到去重后的疾病名稱列表;
將所述去重后的疾病名稱列表輸入到精確匹配模型中,依據標準疾病分類表進行對碼,得到第一對碼結果和候選對碼疾病名稱;
將得到的候選對碼疾病名稱輸入到模糊匹配模型中,依據所述標準疾病分類表進行對碼,得到第二對碼結果;
根據所述第一對碼結果和所述第二對碼結果生成疾病名稱對碼列表。
2.根據權利要求1所述的疾病名稱對碼方法,其特征在于,所述精確匹配模型由若干有序排列的精確匹配子模型組成;所述將所述去重后的疾病名稱列表輸入到精確匹配模型中,依據標準疾病分類表進行對碼,得到第一對碼結果和候選對碼疾病名稱的步驟具體包括:
將所述去重后的疾病名稱列表中的各疾病名稱,按照所述精確匹配模型中精確匹配子模型的排列順序,輸入至精確匹配子模型;
通過當前精確匹配子模型,在標準疾病分類表中查詢與輸入的疾病名稱匹配的標準疾病名稱;
當查詢到匹配的標準疾病名稱時,將查詢到的標準疾病名稱以及與所述標準疾病名稱對應的疾病編碼作為所述疾病名稱的第一對碼結果;
當所述當前精確匹配子模型未查詢到匹配的標準疾病名稱時,將所述疾病名稱輸入至下一個精確匹配子模型繼續執行匹配;
若疾病名稱未被各精確匹配子模型完成匹配,將所述疾病名稱標記為候選對碼疾病名稱。
3.根據權利要求2所述的疾病名稱對碼方法,其特征在于,所述將所述去重后的疾病名稱列表中的各疾病名稱,按照所述精確匹配模型中精確匹配子模型的排列順序,輸入至精確匹配子模型的步驟具體包括:
將所述去重后的疾病名稱列表中的各疾病名稱,按照所述精確匹配模型中四個精確匹配子模型的排列順序,輸入至精確匹配子模型;所述四個精確匹配子模型包括完全匹配子模型、去停用詞子模型、主次分離子模型和同義識別子模型。
4.根據權利要求1所述的疾病名稱對碼方法,其特征在于,所述模糊匹配模型由若干模糊匹配子模型組成;所述將得到的候選對碼疾病名稱輸入到模糊匹配模型中,依據所述標準疾病分類表進行對碼,得到第二對碼結果的步驟具體包括:
將得到的候選對碼疾病名稱輸入到所述模糊匹配模型中的各模糊匹配子模型;
基于所述各模糊匹配子模型,計算所述候選對碼疾病名稱與所述標準疾病分類表中各標準疾病名稱的相似度;
根據所述各模糊匹配子模型計算得到的相似度,生成第二對碼結果。
5.根據權利要求4所述的方法,其特征在于,所述將得到的候選對碼疾病名稱輸入到所述模糊匹配模型中的各模糊匹配子模型的步驟具體包括:
將得到的候選對碼疾病名稱輸入到所述模糊匹配模型中的四個模糊匹配子模型,所述四個模糊匹配子模型包括詞頻匹配子模型、N-Gram子模型、編輯距離子模型和余弦計算子模型。
6.根據權利要求5所述的疾病名稱對碼方法,其特征在于,當所述模糊匹配子模型為編輯距離子模型時,所述候選對碼疾病名稱與所述標準疾病分類表中各標準疾病名稱的相似度的計算步驟具體包括:
計算所述候選對碼疾病名稱與所述標準疾病分類表中各標準疾病名稱的文本編輯距離;
將各文本編輯距離進行歸一化,并以歸一化之后的各文本編輯距離作為所述候選對碼疾病名稱與所述各標準疾病名稱的相似度。
7.根據權利要求4所述的疾病名稱對碼方法,其特征在于,所述根據所述各模糊匹配子模型計算得到的相似度,生成第二對碼結果的步驟具體包括:
對于每個候選對碼疾病名稱,從所述各模糊匹配子模型計算得到的相似度中,篩選最大相似度所對應的標準疾病名稱和疾病編碼進行HardVoting融合,得到第二對碼結果;
或者,
根據所述各模糊匹配模型計算得到的相似度進行SoftVoting融合,得到第二對碼結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010340354.6/1.html,轉載請聲明來源鉆瓜專利網。





