[發明專利]解決醫療數據標準編碼對照問題的映射處理系統及方法有效
| 申請號: | 201410374349.1 | 申請日: | 2014-07-31 |
| 公開(公告)號: | CN104156415B | 公開(公告)日: | 2017-04-12 |
| 發明(設計)人: | 李軼強;馬國耀;蔡軍;孫勇韜;肖華 | 申請(專利權)人: | 沈陽銳易特軟件技術有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 沈陽東大知識產權代理有限公司21109 | 代理人: | 朱光林 |
| 地址: | 110179 遼寧省沈*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 解決 醫療 數據 標準 編碼 對照 問題 映射 處理 系統 方法 | ||
1.一種解決醫療數據標準編碼對照問題的映射處理系統,其特征在于:包括:資源詞庫、目標值域庫、模擬語義分詞單元、模糊匹配單元、精確匹配單元、匹配表和人工管理單元;
資源詞庫:存儲有基礎詞匯和醫療專業詞匯;
目標值域庫:用于存儲標準碼,即GB/T或醫療行業規范定義的編碼值;
模擬語義分詞單元:包括分詞模塊、詞庫加載模塊、詞元處理模塊、相似度評估模塊和分析模塊;
所述分詞模塊用于采用最細粒度分詞方式或智能分詞方式對數據源提供的數據信息進行語義分解和分詞切分處理;
所述詞庫加載模塊用于實現字典加載管理,對資源詞庫信息進行加載,將資源詞庫中的基礎詞匯和醫療專業詞匯加載到緩存中,為詞元處理模塊提供詞元信息;
所述詞元處理模塊對詞庫加載模塊提供的詞元信息進行緩存,對中文詞匯、數量詞匯、字母詞匯進行分類處理,并為分析模塊提供詞元支撐;
所述相似度評估模塊用于對分類處理后數據的相似度評估,得到相似度評估結果;
所述分析模塊用于對調度分詞模塊、相似度評估模塊、詞元處理模塊進行協調調度,并將相似度評估結果作為模擬語義分詞結果輸出至模糊匹配單元;
模糊匹配單元:包括語法分析模塊、索引創建模塊、索引存儲模塊、索引庫、索引搜索模塊、相關性排序模塊和匹配優化模塊;
模糊匹配單元用于根據目標值域庫信息對模擬語義分詞處理結果進行模糊匹配處理;
所述語法分析模塊用于對模擬語義分詞結果進行語法分析和語言處理形成若干詞;
所述索引創建模塊用于根據語法分析模塊形成的若干詞生成詞典索引和反向索引;
所述索引存儲模塊用于根據詞典索引和反向索引對形成的若干詞進行關聯后存儲到索引庫中;
所述索引庫用于存儲詞典索引和反向索引;
所述索引搜索模塊用于將索引庫中的詞典索引和反向索引載入到內存,利用查詢樹搜索索引,得到每個詞對應的數據源信息鏈表,對該信息鏈表進行布爾運算后獲得數據源信息的具體指向位置,從而得到索引搜索結果;
所述相關性排序模塊用于計算索引搜索結果與源詞庫中的醫療專業詞匯的相關度并進行排序;
所述匹配優化模塊用于根據相關度閾值來選取資源詞庫中的醫療專業詞匯與數據源信息鏈的最佳匹配關聯關系,并經過人工校驗后將該最佳匹配關聯關系作為模糊匹配結果存儲至匹配表中;
精確匹配單元:包括數據獲取模塊和精確匹配模塊;
所述數據獲取模塊用于獲取數據源提供的數據信息;
所述精確匹配模塊用于根據數據獲取模塊獲取的數據源提供的數據信息與目標值域庫存儲的標準碼或者匹配表存儲的映射匹配規則信息進行精確匹配映射,生成數據映射匹配結果,即精確匹配結果;
所述匹配表用于存儲映射匹配規則信息,映射匹配規則信息即數據源的數據信息與目標值域庫間的匹配關聯關系;
人工管理單元:用于對資源詞庫、目標值域庫與匹配表進行調整。
2.采用權利要求1所述的解決醫療數據標準編碼對照問題的映射處理系統的醫療數據映射處理方法,其特征在于:包括以下步驟:
步驟1:從醫療數據源獲取數據,根據目標值域庫存儲的標準碼或匹配表存儲的存儲映射匹配規則信息,對獲取的數據進行精確匹配映射:若獲取的數據與匹配表存儲的映射匹配規則信息完全匹配,則執行步驟4;否則,執行步驟2;
步驟2:對從數據源獲取的數據進行模糊語義分析;
步驟2-1:通過對資源詞庫信息進行加載,將資源詞庫中的基礎詞匯和醫療專業詞匯加載到緩存中,為詞元處理提供詞元信息;
步驟2-2:采用最細粒度分詞方式或智能分詞方式對數據源提供的數據信息進行分詞處理,包括語義分解和分詞切分處理;
步驟2-3:進行詞元處理:對資源詞庫中的基礎詞匯和醫療專業詞匯進行緩存,對中文詞匯、數量詞匯、字母詞匯進行分類處理;
步驟2-4:對加載的詞元信息與分詞處理后的數據進行相似度評估,得到相似度評估結果;
步驟2-5:將相似度評估結果作為模擬語義分詞結果;
步驟3:對模擬語義分詞結果進行模糊匹配處理,并生成映射匹配結果;
步驟3-1:對模擬語義分詞結果進行語法分析和語言處理形成若干詞;
步驟3-2:根據形成的若干詞生成詞典索引和反向索引;
步驟3-3:根據詞典索引和反向索引對形成的若干詞進行關聯后存儲到索引庫中;
步驟3-4:將索引庫中的詞典索引和反向索引載入到內存,利用查詢樹搜索索引,得到每個詞對應的數據源信息鏈表,對該信息鏈表進行布爾運算后獲得數據源信息的具體指向位置,從而得到索引搜索結果;
步驟3-5:計算各索引搜索結果與目標值域庫中的標準碼之間的關聯度,并對各關聯度進行排序;
步驟3-6:人工設定關聯度閾值,對符合關聯度閾值的索引搜索結果進行人工校驗,并建立匹配關聯關系,該匹配關聯關系作為映射匹配規則信息存儲至匹配表中;
步驟4:根據匹配表中的映射匹配規則信息將醫療數據映射成標準碼,生成醫療數據映射處理結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于沈陽銳易特軟件技術有限公司,未經沈陽銳易特軟件技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410374349.1/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





