[發明專利]基于電子病歷信息的中文疾病名稱智能標準化方法與系統有效
| 申請號: | 201911232227.8 | 申請日: | 2019-12-05 |
| 公開(公告)號: | CN110991170B | 公開(公告)日: | 2021-10-12 |
| 發明(設計)人: | 鄧柯;李祺;劉軍 | 申請(專利權)人: | 清華大學 |
| 主分類號: | G06F40/279 | 分類號: | G06F40/279;G06F40/126;G06K9/62;G16H10/60 |
| 代理公司: | 深圳市鼎言知識產權代理有限公司 44311 | 代理人: | 鄭海威;曾昭毅 |
| 地址: | 100084 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 電子 病歷 信息 中文 疾病 名稱 智能 標準化 方法 系統 | ||
1.一種基于電子病歷信息的中文疾病名稱智能標準化方法,其特征在于,所述方法包括:
獲取待處理的電子病歷,從所述電子病歷中提取疾病名稱;
將提取出的所述疾病名稱輸入至預設的標準化概率模型,得到所述疾病名稱對應的標準化編碼;
其中,所述標準化概率模型的生成方式為:
獲取多份歷史電子病歷,從所述歷史電子病歷中提取疾病名稱以及與所述疾病名稱對應的疾病編碼,去除所述疾病名稱和所述疾病編碼中多余的空格、標點、字符信息后生成疾病名稱與疾病編碼的映射列表;
從預設的分類算法中選取至少兩種分類算法建立至少兩個預測模型,選擇所述疾病名稱與疾病編碼映射列表中的數據分別對所述至少兩個預測模型進行訓練;
對所述至少兩個預測模型進行模型平均,得到標準化概率模型,包括:
統計樸素貝葉斯算法的預測模型、多分類支持向量機算法的預測模型、邏輯回歸分類算法的預測模型、決策樹分類算法的預測模型、神經網絡算法的預測模型中至少兩個預測模型的預測準確率;
根據所述至少兩個預測模型的預測準確率賦予預設權重值,其中預測準確率高的預測模型賦予的權重值高;
其中,所述標準化概率模型包含所述至少兩個預測模型以及每一預測模型對應的權重。
2.如權利要求1所述的基于電子病歷信息的中文疾病名稱智能標準化方法,其特征在于,所述預測模型的訓練方法包括:
獲取多份歷史電子病歷,所述多份歷史電子病歷中包括疾病名稱和所述疾病名稱對應的疾病編碼;
從所述歷史電子病歷里獲取疾病名稱和所述疾病名稱對應的疾病編碼,生成疾病名稱與疾病編碼的映射列表;
對所述映射列表中的數據進行預設次數的交叉驗證,在每次交叉驗證中將其分為訓練集和驗證集;
建立基于分類算法的預測模型,并利用所述訓練集對所述預測模型進行訓練;
利用訓練后的所述預測模型對所述驗證集中的疾病名稱進行預測,并將預測得到的疾病編碼與驗證集中疾病名稱對應的疾病編碼進行比對;
若經過比對,所述預測的疾病名稱的標準化編碼與驗證集中疾病名稱對應的疾病編碼不一致,則對驗證集中的疾病名稱進行修正后重新代入預測模型進行預測。
3.如權利要求1所述的基于電子病歷信息的中文疾病名稱智能標準化方法,其特征在于,建立所述標準化概率模型之后還包括:
獲取所述標準化概率模型的預測結果,并根據預測結果建立映射規則數據庫和錯誤匹配數據清單;
其中,所述映射規則數據庫中存儲了獲取的電子病歷中的疾病名稱與疾病編碼匹配的映射關系;
所述錯誤匹配數據清單中存儲了獲取的電子病歷中的疾病名稱與疾病編碼不匹配的疾病名稱和疾病編碼清單。
4.如權利要求3所述的基于電子病歷信息的中文疾病名稱智能標準化方法,其特征在于,獲取所述標準化概率模型的預測結果,并根據預測結果建立映射規則數據庫和錯誤匹配數據清單的步驟包括:
將根據所述標準化概率模型預測的疾病名稱在標準化編碼下的預測概率與一預設的概率閾值進行比較;
若經過所述標準化概率模型預測的疾病名稱在疾病名稱的標準化編碼下的預測概率大于預設的概率閾值,則將電子病歷中獲取的疾病名稱與疾病編碼的映射關系存儲于映射規則數據庫,所述映射規則數據庫中存儲了獲取的電子病歷中的疾病名稱與疾病編碼匹配的映射關系;
若經過所述標準化概率模型預測的疾病名稱在疾病名稱的標準化編碼下的預測概率小于預設的概率閾值,則將電子病歷中獲取的疾病名稱與疾病編碼的映射關系存儲于錯誤匹配數據清單,所述錯誤匹配數據清單中存儲了獲取的電子病歷中的疾病名稱與疾病編碼不匹配的疾病名稱和疾病編碼清單。
5.如權利要求4所述的基于電子病歷信息的中文疾病名稱智能標準化方法,其特征在于,所述步驟還包括:
接收更正指令,對所述錯誤匹配數據清單中數據進行更正,所述更正的內容包括如下一種或兩種:更正疾病名稱的描述方式、更正與疾病名稱不匹配的疾病編碼。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清華大學,未經清華大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911232227.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:專用球墨鑄鐵穿墻管
- 下一篇:戶外運動針織面料的生產工藝
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





