[發明專利]一種臨床診斷標準詞的匹配方法及裝置有效
| 申請號: | 202310954858.0 | 申請日: | 2023-08-01 |
| 公開(公告)號: | CN116663536B | 公開(公告)日: | 2023-10-24 |
| 發明(設計)人: | 張奇;王勤勤;王實 | 申請(專利權)人: | 北京惠每云科技有限公司 |
| 主分類號: | G06F40/247 | 分類號: | G06F40/247;G06F40/205;G06F40/284;G06F16/35;G06F16/36;G06N3/045;G06N3/0442;G06N3/08 |
| 代理公司: | 北京超凡宏宇知識產權代理有限公司 11463 | 代理人: | 于彬 |
| 地址: | 100191 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 臨床 診斷 標準 匹配 方法 裝置 | ||
1.一種臨床診斷標準詞的匹配方法,其特征在于,所述匹配方法包括:
通過對獲取到的病歷文本進行分析處理,從所述病歷文本中提取出臨床診斷原詞;
對所述臨床診斷原詞進行預處理,得到標準診斷原詞;
分別在預先構建的醫療文本庫和醫療知識圖譜中搜索,確定所述標準診斷原詞的原詞上下文特征以及每個候選診斷標準詞的標準上下文特征;
基于所述原詞上下文特征和每個標準上下文特征,通過預先訓練好的標準詞匹配模型,從至少一個候選診斷標準詞中,確定出與所述臨床診斷原詞相匹配的至少一個目標診斷標準詞。
2.根據權利要求1所述的匹配方法,其特征在于,對所述臨床診斷原詞進行預處理,得到標準診斷原詞,包括:
針對于所述臨床診斷原詞中包括的全角字符,將所述全角字符轉換為半角字符,得到字符轉換后的臨床診斷原詞;
針對于所述字符轉換后的臨床診斷原詞中包括的小寫字母,將所述小寫字母轉換為大寫字母,得到字母轉換后的臨床診斷原詞。
3.根據權利要求1所述的匹配方法,其特征在于,所述分別在預先構建的醫療文本庫和醫療知識圖譜中搜索,確定所述臨床診斷原詞的原詞上下文特征以及每個候選診斷標準詞的標準上下文特征,包括:
分別利用所述標準診斷原詞和每個候選診斷標準詞,在預先構建的醫療文本庫中搜索,確定出現所述標準診斷原詞的第一病歷原文和出現每個候選診斷標準詞的第二病歷原文;
分別利用所述標準診斷原詞和每個候選診斷標準詞,在預先構建的醫療知識圖譜中搜索,獲取所述標準診斷原詞對應的原詞圖嵌入特征和每個候選診斷標準詞的候選圖嵌入特征;
將所述標準診斷原詞、所述第一病歷原文以及所述原詞圖嵌入特征,確定為所述標準診斷原詞的原詞上下文特征;
針對于每個候選診斷標準詞,將該候選診斷標準詞、該候選診斷標準詞的第二病歷原文和該候選診斷標準詞的候選圖嵌入特征,確定為該候選診斷標準詞的標準上下文特征。
4.根據權利要求1所述的匹配方法,其特征在于,所述標準詞匹配模型包括Bert模型和分類器;所述基于所述原詞上下文特征和每個標準上下文特征,通過預先訓練好的標準詞匹配模型,從至少一個候選診斷標準詞中,確定出與所述臨床診斷原詞相匹配的至少一個目標診斷標準詞,包括:
將所述原詞上下文特征和每個標準上下文特征作為輸入特征,輸入預先訓練好的Bert模型,確定所述標準診斷原詞與每個候選診斷標準詞之間的關聯相似度以及所述臨床診斷原詞所匹配的目標診斷標準詞的匹配數量;
基于確定出的至少一個關聯相似度和所述匹配數量,通過預先訓練好的分類器,從所述至少一個候選診斷標準詞中確定出所述匹配數量的目標診斷標準詞。
5.根據權利要求4所述的匹配方法,其特征在于,所述Bert模型包括第一Bert子模型和第二Bert子模型;所述將所述原詞上下文特征和每個標準上下文特征作為輸入特征,輸入預先訓練好的Bert模型,確定所述標準診斷原詞與每個候選診斷標準詞之間的關聯相似度以及所述臨床診斷原詞所匹配的目標診斷標準詞的匹配數量,包括:
將所述原詞上下文特征和每個標準上下文特征,輸入所述第一Bert子模型,確定所述標準診斷原詞與每個候選診斷標準詞之間的關聯相似度;
將所述原詞上下文特征輸入所述第二Bert子模型,預測所述臨床診斷原詞所匹配的目標診斷標準詞的匹配數量。
6.根據權利要求1所述的匹配方法,其特征在于,通過以下步驟確定至少一個候選診斷標準詞:
獲取標準詞庫中已存儲的多個預設診斷標準詞;
針對于每個預設診斷標準詞,對該預設診斷標準詞進行分詞處理,得到該預設診斷標準詞的多個子分詞;
借助于開源自然語言處理庫,將所述多個子分詞進行向量化處理,得到該預設診斷標準詞的向量表示形式;
基于每個預設診斷標準詞的向量表示形式以及所述標準診斷原詞的向量表示形式,確定所述標準診斷原詞與每個預設診斷標準詞的相似分值;
基于確定多個相似分值,從所述多個預設診斷標準詞中確定出至少一個候選診斷標準詞。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京惠每云科技有限公司,未經北京惠每云科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310954858.0/1.html,轉載請聲明來源鉆瓜專利網。





