[發(fā)明專利]一種基于中文醫(yī)療主訴分析的臨床數(shù)據(jù)組分類方法在審
| 申請?zhí)枺?/td> | 201910814991.X | 申請日: | 2019-08-30 |
| 公開(公告)號: | CN110517787A | 公開(公告)日: | 2019-11-29 |
| 發(fā)明(設(shè)計)人: | 曹夢莉;王國超 | 申請(專利權(quán))人: | 山東健康醫(yī)療大數(shù)據(jù)有限公司 |
| 主分類號: | G16H50/70 | 分類號: | G16H50/70;G16H80/00;G06F16/35;G06F17/27;G06N20/00 |
| 代理公司: | 37100 濟南信達專利事務(wù)所有限公司 | 代理人: | 郗艷榮<國際申請>=<國際公布>=<進入 |
| 地址: | 250117 山東省濟南市槐*** | 國省代碼: | 山東;37 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 數(shù)據(jù)組 主訴 臨床數(shù)據(jù) 組分類 檢查數(shù)據(jù) 臨床檢驗 使用機器 數(shù)據(jù)中心 醫(yī)生錄入 分析 中文 醫(yī)療 知識庫 醫(yī)院信息系統(tǒng) 分析處理 工作效率 獲取數(shù)據(jù) 精準分類 數(shù)據(jù)分類 數(shù)據(jù)類別 數(shù)據(jù)模型 學(xué)習(xí)算法 重要意義 挖掘 數(shù)據(jù)源 構(gòu)建 算法 隱含 醫(yī)生 學(xué)習(xí) | ||
本發(fā)明特別涉及一種基于中文醫(yī)療主訴分析的臨床數(shù)據(jù)組分類方法。該基于中文醫(yī)療主訴分析的臨床數(shù)據(jù)組分類方法,使用機器學(xué)習(xí)算法對各種臨床檢驗檢查數(shù)據(jù)和醫(yī)生錄入的主訴項組成的數(shù)據(jù)組進行分析挖掘,獲取數(shù)據(jù)組所隱含的信息和知識;根據(jù)醫(yī)院信息系統(tǒng)提供的數(shù)據(jù)源進行分析處理,得到數(shù)據(jù)組的數(shù)據(jù)分類;將數(shù)據(jù)組存入臨床數(shù)據(jù)中心相關(guān)知識庫對應(yīng)的數(shù)據(jù)類別即可。該基于中文醫(yī)療主訴分析的臨床數(shù)據(jù)組分類方法,通過使用機器學(xué)習(xí)相關(guān)算法建立數(shù)據(jù)模型,對各種臨床檢驗檢查數(shù)據(jù)和醫(yī)生錄入的主訴項組成的數(shù)據(jù)組進行分析挖掘,實現(xiàn)了對數(shù)據(jù)組的精準分類,不僅能夠大大提高醫(yī)生的工作效率,還對構(gòu)建院內(nèi)小型、微型臨床數(shù)據(jù)中心具有重要意義。
技術(shù)領(lǐng)域
本發(fā)明涉及機器學(xué)習(xí)算法與數(shù)據(jù)挖掘技術(shù)領(lǐng)域,特別涉及一種基于中文醫(yī)療主訴分析的臨床數(shù)據(jù)組分類方法。
背景技術(shù)
不同的醫(yī)院、醫(yī)院的不同等級,院內(nèi)信息化程度參差不齊,在信息化程度不高的醫(yī)院內(nèi)部,各個業(yè)務(wù)系統(tǒng)存在數(shù)據(jù)孤島,院內(nèi)各系統(tǒng)之間,區(qū)域內(nèi)醫(yī)院和醫(yī)院之間,醫(yī)院和社會公眾之間均存在不同程度的數(shù)據(jù)壁壘。
隨著大數(shù)據(jù)技術(shù)的不斷發(fā)展,在政策和技術(shù)的雙重推動下,醫(yī)院有強烈的意愿消除內(nèi)部的數(shù)據(jù)壁壘,建立微型、小型醫(yī)院臨床數(shù)據(jù)中心,對數(shù)據(jù)的互聯(lián)互通、醫(yī)生的科研需求、院內(nèi)的疾病判斷、減少醫(yī)生誤診率等方面將會有重要的意義。
醫(yī)生在診療過程中,需要很多相關(guān)信息的輔助,最重要的信息來源是患者的各種臨床檢驗檢查數(shù)據(jù)組成的數(shù)據(jù)組。這些檢驗檢測數(shù)據(jù)組成的數(shù)據(jù)組,匯入到疾病數(shù)據(jù)庫之后,能夠形成疾病輔助決策支持,對醫(yī)生的工作進一步形成指導(dǎo),從而準確判斷疾病,給出診療方案,減少技術(shù)上的失誤。因此,若能建立數(shù)據(jù)模型,對各種臨床檢驗檢查數(shù)據(jù)組成的數(shù)據(jù)組進行分析挖掘,實現(xiàn)對數(shù)據(jù)組的精準分類,將會大大提高醫(yī)生的工作效率,對構(gòu)建院內(nèi)小型、微型臨床數(shù)據(jù)中心具有重要意義。
基于上述情況,本發(fā)明提出了一種基于中文醫(yī)療主訴分析的臨床數(shù)據(jù)組分類方法。
發(fā)明內(nèi)容
本發(fā)明為了彌補現(xiàn)有技術(shù)的缺陷,提供了一種簡單高效的基于中文醫(yī)療主訴分析的臨床數(shù)據(jù)組分類方法。
本發(fā)明是通過如下技術(shù)方案實現(xiàn)的:
一種基于中文醫(yī)療主訴分析的臨床數(shù)據(jù)組分類方法,其特征在于:包括以下步驟:
第一步,使用機器學(xué)習(xí)算法對各種臨床檢驗檢查數(shù)據(jù)和醫(yī)生錄入的主訴項組成的數(shù)據(jù)組進行分析挖掘,獲取數(shù)據(jù)組所隱含的信息和知識;
第二步,根據(jù)醫(yī)院信息系統(tǒng)提供的數(shù)據(jù)源對醫(yī)生錄入的主訴項內(nèi)容進行分析處理,結(jié)合獲取到的數(shù)據(jù)組隱含的信息和知識,得到數(shù)據(jù)組的數(shù)據(jù)分類;
第三步,將數(shù)據(jù)組存入臨床數(shù)據(jù)中心相關(guān)知識庫對應(yīng)的數(shù)據(jù)類別即可。
所述第一步中,所述使用機器學(xué)習(xí)算法對各種臨床檢驗檢查數(shù)據(jù)組成的數(shù)據(jù)組進行分析挖掘,包括中文文本預(yù)處理、特征提取、數(shù)據(jù)建模和知識發(fā)現(xiàn)。
所述中文文本預(yù)處理包括文本數(shù)據(jù)清洗、詞切分和數(shù)據(jù)映射。
所述數(shù)據(jù)清洗是指處理缺失數(shù)據(jù)與異常值,并剔除掉原始數(shù)據(jù)中與數(shù)據(jù)建模無關(guān)的數(shù)據(jù)。
所述詞切分是指使用用戶自定義的分詞詞典將各種臨床檢驗檢查數(shù)據(jù)和醫(yī)生錄入的主訴項分別進行分詞;所述用戶自定義的分詞詞典采用主訴相關(guān)醫(yī)學(xué)詞典,并在詞切分時加載使用。
所述數(shù)據(jù)映射是指構(gòu)建檢查及數(shù)據(jù)分類標準映射表,并使用標準映射表分別對各種臨床檢驗檢查數(shù)據(jù)和醫(yī)生錄入的主訴項進行標準化處理。例:高血壓三級(XXX)映射為高血壓三級。
所述特征提取包括以下兩部分:
第一,加載用戶自定義詞典對醫(yī)生錄入的主訴項內(nèi)容進行分詞,轉(zhuǎn)換為詞向量后提取主訴特征詞后,對主訴特征詞進行編碼轉(zhuǎn)換;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于山東健康醫(yī)療大數(shù)據(jù)有限公司,未經(jīng)山東健康醫(yī)療大數(shù)據(jù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910814991.X/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 臨床數(shù)據(jù)處理系統(tǒng)
- 用于臨床歷史片斷的迭代構(gòu)建的系統(tǒng)和方法
- 一種臨床數(shù)據(jù)判定的方法、裝置、設(shè)備和存儲介質(zhì)
- 一種基于Excel導(dǎo)入的臨床業(yè)務(wù)自動建庫方法
- 一種基于大數(shù)據(jù)技術(shù)的區(qū)域臨床路徑管理系統(tǒng)
- 一種基于云平臺的臨床數(shù)據(jù)服務(wù)系統(tǒng)及方法
- 一種臨床數(shù)據(jù)管理方法
- 一種臨床數(shù)據(jù)的采集方法
- 臨床路徑的挖掘方法、裝置、設(shè)備及存儲介質(zhì)
- 基于藥代學(xué)評價聚卡波非鈣片臨床數(shù)據(jù)管理統(tǒng)計分析方法





