[發明專利]一種多重診斷智能編碼方法、系統、介質及設備有效
| 申請號: | 202110038682.5 | 申請日: | 2021-01-12 |
| 公開(公告)號: | CN112836006B | 公開(公告)日: | 2022-09-23 |
| 發明(設計)人: | 李森;吳軍;孫釗;桑波;李福友;郝旭陽;魯成霞 | 申請(專利權)人: | 山東眾陽健康科技集團有限公司 |
| 主分類號: | G06F16/31 | 分類號: | G06F16/31;G06F40/289;G16H10/60 |
| 代理公司: | 濟南圣達知識產權代理有限公司 37221 | 代理人: | 張慶騫 |
| 地址: | 250000 山東省濟南市高*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 多重 診斷 智能 編碼 方法 系統 介質 設備 | ||
1.一種多重診斷智能編碼方法,其特征在于,包括:
接收臨床原始多重診斷數據并進行預處理操作;
將預處理后多重診斷數據進行分詞處理,得到分詞結果集合;分詞結果集合中的元素由修飾詞和主導詞組合構成;
將分詞結果集合中所有詞匯進行語義聯想轉換處理;
將語義聯想轉換處理得到的全組合進行語匹配樹搜索處理,對篩選出來的匹配樹按匹配組的匹配度從高到低進行降序排列,取排序第一的匹配樹組作為編碼結果;
其中,匹配樹的樹根是疾病標準編碼,樹干是診斷名稱,樹枝是診斷名稱的具體組成部分,樹葉是診斷拆分的主導詞和修飾詞;
匹配樹相似度指的是診斷數據與匹配樹的相似度,其計算過程為:
將各診斷關鍵詞到匹配樹葉子關鍵詞的路徑長度求自然對數并進行累加;
所述匹配樹按匹配度從高到低進行降序排列,具體步驟是:
步驟(a1):選取所有匹配樹的主導詞是組合關鍵詞所有主導詞子集,并且組合關鍵詞的所有修飾詞是匹配樹修飾詞子集的匹配樹,作為候選匹配樹集Treeset={Tree1,Tree2...Treen};
步驟(a2):將候選匹配樹集分組,其中各匹配樹主導詞不能重復,即各組內匹配樹主導詞交集為空;
步驟(a3)計算各匹配組的匹配度,將匹配樹候選組按匹配度進行降序排列;匹配組中匹配樹個數為ntree,修飾詞與主導詞距離Sdistance,匹配樹組所有主導詞與組合關鍵詞中主導詞交集的元素個數nmain,匹配樹組所有修飾詞與組合關鍵詞中修飾詞交集的元素個數nmodifier,匹配樹相似度Ssim組成集合X={ntree,sdiatance,nmain,nmodifier,ssim},匹配度為:
Match=αTX
其中,αT為加權系數,然后按照匹配度由高到低進行排序,取排序第一的匹配樹組作為編碼結果。
2.如權利要求1所述的多重診斷智能編碼方法,其特征在于,所述預處理操作包括特殊字符的處理、異體字的轉換以及標點符號的處理。
3.如權利要求1所述的多重診斷智能編碼方法,其特征在于,經語義聯想轉換處理后,得到主導詞與修飾詞的所有轉換可能集合,進而得到主導詞轉換集合與修飾詞轉換集合組成的全組合集。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山東眾陽健康科技集團有限公司,未經山東眾陽健康科技集團有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110038682.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于深度學習和知識圖譜的患者畫像方法及系統
- 下一篇:制備阿塞那平的方法





