[發明專利]醫學實體的概念識別方法、裝置、設備及存儲介質在審
| 申請號: | 202110592931.5 | 申請日: | 2021-05-28 |
| 公開(公告)號: | CN113204968A | 公開(公告)日: | 2021-08-03 |
| 發明(設計)人: | 于鳳英;王健宗 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F40/295 | 分類號: | G06F40/295;G06F40/30 |
| 代理公司: | 深圳市明日今典知識產權代理事務所(普通合伙) 44343 | 代理人: | 王杰輝;宋慶洪 |
| 地址: | 518000 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 醫學 實體 概念 識別 方法 裝置 設備 存儲 介質 | ||
本申請為數字醫療技術領域,本申請提供了一種醫學實體的概念識別方法、裝置、設備及存儲介質,其中,所述方法包括:獲取文本信息,從文本信息中提取出待識別醫學實體,將待識別醫學實體輸入預先訓練好的bert模型中,利用bert模型的候選生成器生成待識別醫學實體對應的候選概念列表;利用bert模型的候選排序器從候選概念列表中篩選出排在前N位的候選概念,得到待識別醫學實體的目標概念。本發明通過bert模型的候選生成器從現有知識庫中篩選出合適的候選概念,并通過候選排序器進一步篩選出滿足要求的目標概念,由于候選排序器對待識別醫學實體和候選概念進行成對預測,因此能夠準確預測出未出現過的醫學實體的概念。
技術領域
本申請涉及數字醫療技術領域,具體而言,本申請涉及一種醫學實體的概念識別方法、裝置、設備及存儲介質。
背景技術
生物醫學領域中非結構化文本的挖掘和分析任務為醫學發展提供了巨大的機遇,然而,詞匯和語法變化的多樣性為自然語言處理(NLP)技術的發展提出了關鍵問題。例如,心臟病發作、心肌梗死、心肌梗塞和心血管卒這些醫學實體都是指同一個概念,通過將它們與本體或知識庫中相應的概念聯系起來,消除這些術語的歧義是至關重要的,這一任務稱為概念規范化。
傳統的概念規范化方法通常是通過字符串匹配和字典查找實現,但這種實現方式對于未出現過的醫學實體,則無法準確預測其概念。
發明內容
本申請的主要目的為提供一種醫學實體的概念識別方法、裝置、設備及存儲介質,以實現準確預測未出現過的醫學實體的概念。
為了實現上述發明目的,本申請提供一種醫學實體的概念識別方法,其包括以下步驟:
獲取文本信息,從所述文本信息中提取出待識別醫學實體;
將所述待識別醫學實體輸入預先訓練好的bert模型中,利用所述bert模型的候選生成器生成所述待識別醫學實體對應的候選概念列表;其中,所述候選生成器用于從知識庫中篩選出若干個候選概念,并基于所述候選概念生成候選概念列表;
利用所述bert模型的候選排序器從所述候選概念列表中篩選出排在前N位的候選概念,得到所述待識別醫學實體的目標概念;其中,所述N為大于等于1的正整數,所述候選排序器用于根據預設排序規則對所述候選概念列表中的所有候選概念進行排序。
優選地,利用所述bert模型的候選生成器生成所述待識別醫學實體對應的候選概念列表的步驟,包括:
利用所述候選生成器確定所述待識別醫學實體對應的第一隱藏向量及預設的第一權重;
根據所述第一隱藏向量及第一權重計算所述知識庫中所有概念分別描述所述待識別醫學實體時的評分值;
獲取所有概念的獨熱編碼向量,根據所述獨熱編碼向量及評分值計算所有概念的第一標準分類損失值,基于所述第一標準分類損失值確定所述待識別醫學實體對應的候選概念列表。
優選地,所述基于所述第一標準分類損失值確定所述待識別醫學實體對應的候選概念列表的步驟,包括:
利用所有概念的第一標準分類損失值計算各個概念的概念概率;其中,所述概念概率用于表征各個概念屬于描述所述待識別醫學實體的概念的可能性;
根據所述概念概率從知識庫中篩選出若干個候選概念,并基于所述候選概念生成候選概念列表。
優選地,利用所述bert模型的候選排序器從所述候選概念列表中篩選出排在前N位的候選概念的步驟,包括:
利用所述bert模型的候選排序器確定所述待識別醫學實體對應的第二隱藏向量及預設的第二權重;
將所述候選概念列表中所有候選概念的第二隱藏向量連接形成矩陣;
利用所述矩陣及預設的第二權重計算所述候選概念的第二標準分類損失值;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110592931.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種番茄采摘機械手
- 下一篇:一種對象關聯方法、裝置及電子設備





