[發(fā)明專利]疾病名稱對碼方法、裝置、計算機(jī)設(shè)備及存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202010340354.6 | 申請日: | 2020-04-26 |
| 公開(公告)號: | CN111695336A | 公開(公告)日: | 2020-09-22 |
| 發(fā)明(設(shè)計)人: | 金曉輝;阮曉雯;徐亮 | 申請(專利權(quán))人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F40/216 | 分類號: | G06F40/216;G06F40/289;G06F16/2458;G06F16/28;G16H10/60 |
| 代理公司: | 深圳市世聯(lián)合知識產(chǎn)權(quán)代理有限公司 44385 | 代理人: | 汪琳琳 |
| 地址: | 518000 廣東省深圳市福田區(qū)福*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 疾病 名稱 方法 裝置 計算機(jī) 設(shè)備 存儲 介質(zhì) | ||
1.一種疾病名稱對碼方法,其特征在于,包括下述步驟:
從電子病歷中獲取疾病名稱列表;
對所述疾病名稱列表中重復(fù)的疾病名稱進(jìn)行去重處理,得到去重后的疾病名稱列表;
將所述去重后的疾病名稱列表輸入到精確匹配模型中,依據(jù)標(biāo)準(zhǔn)疾病分類表進(jìn)行對碼,得到第一對碼結(jié)果和候選對碼疾病名稱;
將得到的候選對碼疾病名稱輸入到模糊匹配模型中,依據(jù)所述標(biāo)準(zhǔn)疾病分類表進(jìn)行對碼,得到第二對碼結(jié)果;
根據(jù)所述第一對碼結(jié)果和所述第二對碼結(jié)果生成疾病名稱對碼列表。
2.根據(jù)權(quán)利要求1所述的疾病名稱對碼方法,其特征在于,所述精確匹配模型由若干有序排列的精確匹配子模型組成;所述將所述去重后的疾病名稱列表輸入到精確匹配模型中,依據(jù)標(biāo)準(zhǔn)疾病分類表進(jìn)行對碼,得到第一對碼結(jié)果和候選對碼疾病名稱的步驟具體包括:
將所述去重后的疾病名稱列表中的各疾病名稱,按照所述精確匹配模型中精確匹配子模型的排列順序,輸入至精確匹配子模型;
通過當(dāng)前精確匹配子模型,在標(biāo)準(zhǔn)疾病分類表中查詢與輸入的疾病名稱匹配的標(biāo)準(zhǔn)疾病名稱;
當(dāng)查詢到匹配的標(biāo)準(zhǔn)疾病名稱時,將查詢到的標(biāo)準(zhǔn)疾病名稱以及與所述標(biāo)準(zhǔn)疾病名稱對應(yīng)的疾病編碼作為所述疾病名稱的第一對碼結(jié)果;
當(dāng)所述當(dāng)前精確匹配子模型未查詢到匹配的標(biāo)準(zhǔn)疾病名稱時,將所述疾病名稱輸入至下一個精確匹配子模型繼續(xù)執(zhí)行匹配;
若疾病名稱未被各精確匹配子模型完成匹配,將所述疾病名稱標(biāo)記為候選對碼疾病名稱。
3.根據(jù)權(quán)利要求2所述的疾病名稱對碼方法,其特征在于,所述將所述去重后的疾病名稱列表中的各疾病名稱,按照所述精確匹配模型中精確匹配子模型的排列順序,輸入至精確匹配子模型的步驟具體包括:
將所述去重后的疾病名稱列表中的各疾病名稱,按照所述精確匹配模型中四個精確匹配子模型的排列順序,輸入至精確匹配子模型;所述四個精確匹配子模型包括完全匹配子模型、去停用詞子模型、主次分離子模型和同義識別子模型。
4.根據(jù)權(quán)利要求1所述的疾病名稱對碼方法,其特征在于,所述模糊匹配模型由若干模糊匹配子模型組成;所述將得到的候選對碼疾病名稱輸入到模糊匹配模型中,依據(jù)所述標(biāo)準(zhǔn)疾病分類表進(jìn)行對碼,得到第二對碼結(jié)果的步驟具體包括:
將得到的候選對碼疾病名稱輸入到所述模糊匹配模型中的各模糊匹配子模型;
基于所述各模糊匹配子模型,計算所述候選對碼疾病名稱與所述標(biāo)準(zhǔn)疾病分類表中各標(biāo)準(zhǔn)疾病名稱的相似度;
根據(jù)所述各模糊匹配子模型計算得到的相似度,生成第二對碼結(jié)果。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述將得到的候選對碼疾病名稱輸入到所述模糊匹配模型中的各模糊匹配子模型的步驟具體包括:
將得到的候選對碼疾病名稱輸入到所述模糊匹配模型中的四個模糊匹配子模型,所述四個模糊匹配子模型包括詞頻匹配子模型、N-Gram子模型、編輯距離子模型和余弦計算子模型。
6.根據(jù)權(quán)利要求5所述的疾病名稱對碼方法,其特征在于,當(dāng)所述模糊匹配子模型為編輯距離子模型時,所述候選對碼疾病名稱與所述標(biāo)準(zhǔn)疾病分類表中各標(biāo)準(zhǔn)疾病名稱的相似度的計算步驟具體包括:
計算所述候選對碼疾病名稱與所述標(biāo)準(zhǔn)疾病分類表中各標(biāo)準(zhǔn)疾病名稱的文本編輯距離;
將各文本編輯距離進(jìn)行歸一化,并以歸一化之后的各文本編輯距離作為所述候選對碼疾病名稱與所述各標(biāo)準(zhǔn)疾病名稱的相似度。
7.根據(jù)權(quán)利要求4所述的疾病名稱對碼方法,其特征在于,所述根據(jù)所述各模糊匹配子模型計算得到的相似度,生成第二對碼結(jié)果的步驟具體包括:
對于每個候選對碼疾病名稱,從所述各模糊匹配子模型計算得到的相似度中,篩選最大相似度所對應(yīng)的標(biāo)準(zhǔn)疾病名稱和疾病編碼進(jìn)行HardVoting融合,得到第二對碼結(jié)果;
或者,
根據(jù)所述各模糊匹配模型計算得到的相似度進(jìn)行SoftVoting融合,得到第二對碼結(jié)果。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于平安科技(深圳)有限公司,未經(jīng)平安科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010340354.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 疾病風(fēng)險預(yù)測方法以及執(zhí)行該方法的裝置
- 利用疾病與人體部位的映射進(jìn)行疾病信息可視化的方法
- 疾病術(shù)語的詞處理方法、裝置及計算機(jī)設(shè)備
- 一種疾病名稱標(biāo)準(zhǔn)化規(guī)范數(shù)據(jù)庫及其建立方法
- 疾病預(yù)測方法、裝置、終端及存儲介質(zhì)
- 疾病風(fēng)險預(yù)測方法、裝置、計算機(jī)設(shè)備及計算機(jī)存儲介質(zhì)
- 疾病信息識別方法、裝置、計算機(jī)設(shè)備及存儲介質(zhì)
- 疾病的層級關(guān)系處理方法、裝置及電子設(shè)備
- 一種基于復(fù)雜網(wǎng)絡(luò)的疾病進(jìn)展路徑挖掘方法
- 知識圖譜的構(gòu)建和使用方法、裝置和介質(zhì)





