[發(fā)明專利]一種中醫(yī)臨床數(shù)據(jù)清洗方法在審
| 申請?zhí)枺?/td> | 201710281062.8 | 申請日: | 2017-04-26 |
| 公開(公告)號: | CN107103196A | 公開(公告)日: | 2017-08-29 |
| 發(fā)明(設(shè)計)人: | 溫川飆;程小恩;曾祥明 | 申請(專利權(quán))人: | 成都中醫(yī)藥大學(xué) |
| 主分類號: | G06F19/00 | 分類號: | G06F19/00;G06F17/30 |
| 代理公司: | 四川力久律師事務(wù)所51221 | 代理人: | 陳明龍,曹晉玲 |
| 地址: | 610075 *** | 國省代碼: | 四川;51 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 中醫(yī) 臨床 數(shù)據(jù) 清洗 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明中醫(yī)臨床領(lǐng)域,特別是一種中醫(yī)臨床數(shù)據(jù)清洗方法。
背景技術(shù)
數(shù)據(jù)清洗(Data cleaning)是指發(fā)現(xiàn)并糾正數(shù)據(jù)文件中可識別的錯誤的最后一道程序,包括檢查數(shù)據(jù)一致性,處理無效值和缺失值,其對數(shù)據(jù)進(jìn)行重新審查和校驗,旨在刪除重復(fù)信息、糾正存在的錯誤,并提供數(shù)據(jù)一致性,主要針對的數(shù)據(jù)類型包括殘缺數(shù)據(jù)、錯誤數(shù)據(jù)和重復(fù)數(shù)據(jù)。
中醫(yī)臨床電子病歷數(shù)據(jù)繁復(fù),其主要包括臨床診斷(病名)、四診(望聞問切)、方劑、治法、癥狀、證型、病位、病性等信息(圖1)。由于臨床業(yè)務(wù)量大、方劑種類繁多,中醫(yī)臨床電子病歷往往存在或多或少的數(shù)據(jù)缺失問題,數(shù)據(jù)缺失的電子病歷對于后期的電子病歷分析整理工作效率影響顯著。宋紅梅《電子病歷中醫(yī)科研數(shù)據(jù)采集過程中質(zhì)量問題及對策》提出病歷數(shù)據(jù)錄入階段的質(zhì)量控制與自我檢查,其主要思想是在電子病歷系統(tǒng)中,利用軟件規(guī)則的方式,填寫電子病歷,在一定程度上保證電子病歷的完整性。但該方案僅實現(xiàn)在中醫(yī)臨床電子病歷填寫過程中的補全操作,對于因填寫過程中產(chǎn)生的數(shù)據(jù)缺陷問題不能有效解決。
發(fā)明內(nèi)容
本發(fā)明的目的在于克服現(xiàn)有技術(shù)中所存在的上述不足,提供一種能夠在填寫過程中以及填寫完成后均能完成數(shù)據(jù)補全的中醫(yī)臨床數(shù)據(jù)清洗方法。
為了實現(xiàn)上述發(fā)明目的,本發(fā)明提供了以下技術(shù)方案:
一種中醫(yī)臨床數(shù)據(jù)清洗方法,包括步驟:
S01,獲取電子病歷,通過所述電子病歷中的病名從知識庫中檢索知識數(shù)據(jù)集;
S02,通過所述知識數(shù)據(jù)集中各知識數(shù)據(jù)對應(yīng)的知識編碼檢索對應(yīng)的方劑信息,所述方劑信息包括藥品名稱;
S03,將各知識數(shù)據(jù)中的各藥品名稱與所述電子病歷中的藥品名稱比對,選出藥品名稱比對符合次數(shù)最多且符合率超過指定閾值的知識數(shù)據(jù)作為目標(biāo)知識數(shù)據(jù);
S04,根據(jù)所述目標(biāo)知識數(shù)據(jù)補全所述電子病歷缺失的數(shù)據(jù)。
所述病名(臨床診斷)和所述方劑(藥品)信息是所述電子病歷中的關(guān)鍵數(shù)據(jù),所述知識數(shù)據(jù)至少包括病名(臨床診斷)和方劑信息,還包括與該條知識數(shù)據(jù)對應(yīng)的四診、方劑、治法、癥狀、證型、病位、病性信息,各條所述知識數(shù)據(jù)設(shè)置有唯一映射關(guān)系的知識編碼,任意2條以上所述知識數(shù)據(jù)構(gòu)成所述知識數(shù)據(jù)集。
進(jìn)一步地,步驟S03中,循環(huán)所述電子病歷中的藥品名稱分別與各知識數(shù)據(jù)中的各藥品名稱比對。所述電子病歷中的藥品名稱也歸于所述電子病歷中的方劑信息。
進(jìn)一步地,步驟S04中,所述缺失的數(shù)據(jù)包括四診(望聞問切)、方劑、治法、癥狀、證型、病位、病性信息中的任意一種或多種。所述電子病歷方劑信息中須有藥品名稱,但并不一定包括了對應(yīng)處方的所有藥品名稱,因此所述方劑信息中藥品名稱也應(yīng)按需補全。
基于第一實施方式,步驟S04中,將所述電子病歷中的四診、方劑、治法、癥狀、證型、病位、病性信息分別與所述目標(biāo)知識比對,若所述電子病歷相應(yīng)位置為空值,將所述目標(biāo)知識對應(yīng)位置信息補入所述電子病歷對應(yīng)位置。該實施方式中數(shù)據(jù)補全操作以所述電子病歷為基礎(chǔ),所述電子病歷相應(yīng)位置信息為空,即將所述目標(biāo)知識相應(yīng)位置信息補入,有效解決了缺失值的補充。
進(jìn)一步地,步驟S04中,將所述電子病歷中的四診、方劑、治法、癥狀、證型、病位、病性信息分別與所述目標(biāo)知識比對,若所述電子病歷相應(yīng)位置為非空值,將所述目標(biāo)知識對應(yīng)位置信息與所述電子病歷對應(yīng)位置信息比對,將比對不一致的信息補入所述電子病歷對應(yīng)位置。該實施方式對于所述電子病歷相應(yīng)位置有記載信息,但所述記載信息與所述目標(biāo)知識不一致,將所述目標(biāo)知識對應(yīng)位置信息添入所述電子病歷對應(yīng)位置,進(jìn)一步實現(xiàn)了所述電子病歷的信息完善。優(yōu)選地,為添入的對應(yīng)位置的數(shù)據(jù)信息進(jìn)行標(biāo)注,將其與所述電子病歷對應(yīng)位置的初始信息進(jìn)行區(qū)分。
基于第二實施方式,步驟S04中,將所述電子病歷中的四診、方劑、治法、癥狀、證型、病位、病性信息分別與所述目標(biāo)知識比對,若所述目標(biāo)知識相應(yīng)位置為非空值,將所述目標(biāo)知識對應(yīng)位置信息覆蓋所述電子病歷對應(yīng)位置。該實施方式中數(shù)據(jù)補全操作以所述目標(biāo)知識為模板,當(dāng)所述目標(biāo)知識數(shù)據(jù)對應(yīng)位置為非空值,即將所述目標(biāo)知識對應(yīng)位置信息覆蓋所述電子病歷對應(yīng)位置,該方式有助于數(shù)據(jù)補全的完整性。
進(jìn)一步地,步驟S04中,由于所述證型僅包含單一信息,若證型為非空值,無需補充所述證型信息。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于成都中醫(yī)藥大學(xué),未經(jīng)成都中醫(yī)藥大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710281062.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F19-00 專門適用于特定應(yīng)用的數(shù)字計算或數(shù)據(jù)處理的設(shè)備或方法
G06F19-10 .生物信息學(xué),即計算分子生物學(xué)中的遺傳或蛋白質(zhì)相關(guān)的數(shù)據(jù)處理方法或系統(tǒng)
G06F19-12 ..用于系統(tǒng)生物學(xué)的建模或仿真,例如:概率模型或動態(tài)模型,遺傳基因管理網(wǎng)絡(luò),蛋白質(zhì)交互作用網(wǎng)絡(luò)或新陳代謝作用網(wǎng)絡(luò)
G06F19-14 ..用于發(fā)展或進(jìn)化的,例如:進(jìn)化的保存區(qū)域決定或進(jìn)化樹結(jié)構(gòu)
G06F19-16 ..用于分子結(jié)構(gòu)的,例如:結(jié)構(gòu)排序,結(jié)構(gòu)或功能關(guān)系,蛋白質(zhì)折疊,結(jié)構(gòu)域拓?fù)洌媒Y(jié)構(gòu)數(shù)據(jù)的藥靶,涉及二維或三維結(jié)構(gòu)的
G06F19-18 ..用于功能性基因組學(xué)或蛋白質(zhì)組學(xué)的,例如:基因型–表型關(guān)聯(lián),不均衡連接,種群遺傳學(xué),結(jié)合位置鑒定,變異發(fā)生,基因型或染色體組的注釋,蛋白質(zhì)相互作用或蛋白質(zhì)核酸的相互作用
- 中醫(yī)健康管理系統(tǒng)及智能終端
- 基于中醫(yī)體質(zhì)辨識的健康管理系統(tǒng)及智能終端
- 一種中醫(yī)古代文獻(xiàn)半監(jiān)督學(xué)習(xí)方法和系統(tǒng)
- 一種中醫(yī)健康狀態(tài)多維辨識系統(tǒng)
- 中醫(yī)體質(zhì)類型檢測方法及裝置
- 一種基于證素的中醫(yī)輔助診斷系統(tǒng)
- 基于DAELA-LSTM神經(jīng)網(wǎng)絡(luò)的痛經(jīng)中醫(yī)辨證系統(tǒng)
- 一種基于中醫(yī)養(yǎng)生功法的健康數(shù)據(jù)管理平臺
- 一種面向中醫(yī)古籍文獻(xiàn)的分詞方法和裝置
- 數(shù)據(jù)處理方法、裝置、設(shè)備和存儲介質(zhì)
- 定量臨床和臨床前成像
- 用于管理臨床研究數(shù)據(jù)的機器和方法
- 用于臨床歷史片斷的迭代構(gòu)建的系統(tǒng)和方法
- 一種臨床事件存儲方法及裝置
- 用于基于語義關(guān)系來將自由文本臨床文檔建模為層次圖狀數(shù)據(jù)結(jié)構(gòu)的系統(tǒng)和方法
- 一種基于Excel導(dǎo)入的臨床業(yè)務(wù)自動建庫方法
- 一種基于大數(shù)據(jù)技術(shù)的區(qū)域臨床路徑管理系統(tǒng)
- 一種臨床術(shù)語的管理方法及裝置、可讀存儲介質(zhì)
- 一種臨床數(shù)據(jù)管理方法
- 一種臨床藥物分類管理系統(tǒng)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





