[發明專利]醫學短語匹配方法、裝置、設備及存儲介質有效
| 申請號: | 202011386028.5 | 申請日: | 2020-12-02 |
| 公開(公告)號: | CN112464662B | 公開(公告)日: | 2022-09-30 |
| 發明(設計)人: | 郭建福 | 申請(專利權)人: | 深圳平安醫療健康科技服務有限公司 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F40/166;G06F40/247 |
| 代理公司: | 北京市京大律師事務所 11321 | 代理人: | 姚維 |
| 地址: | 518000 廣東省深圳市福田區華*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 醫學 短語 匹配 方法 裝置 設備 存儲 介質 | ||
本發明涉及人工智能領域,公開了醫學短語匹配方法、裝置、設備及存儲介質,應用于智慧醫療領域中,用于提高臨床醫學短語與標準醫學短語之間的匹配效率。本發明方法包括:獲取待識別短語,待識別短語包括多個醫學實體;在預置的醫學文本庫中確定與待識別短語相關的標準醫學短語集,標準醫學短語集包括多個標準醫學短語;將待識別短語與多個標準醫學短語進行拼接,得到多個待識別醫學語句;將多個待識別醫學語句分別輸入訓練好的BERT模型中,生成多個待識別醫學語句向量;根據多個待識別醫學語句向量生成多個相似度;比較多個相似度的取值大小,確定取值最大的目標相似度,并根據目標相似度確定與待識別短語匹配的標準醫學短語。
技術領域
本發明涉及醫療數據領域,尤其涉及一種醫學短語匹配方法、裝置、設備及存儲介質。
背景技術
醫學臨床短文本標準化是醫學統計中一項必要任務。臨床上,關于同一種診療、手術、疾病等往往會有很多寫法。標準化要解決的問題就是要為臨床上各種不同說法找到對應的標準說法。
預訓練自然語言模型已對幾乎下游所有類型的自然語言處理任務(序列標注、分類、句子關系判斷等)有明顯的促進作用。現有業內主流使用深度學習模型的也大多采用類似的預訓練自然語言模型來解決短文本標準化問題。
現有方案只能為部分臨床醫學短語匹配標準醫學短語,不能覆蓋到所有臨床文本數據,導致匹配模型對臨床醫學短語的匹配效率低,在真實臨床數據場景下的適應性弱。
發明內容
本發明提供了一種醫學短語匹配方法、裝置、設備及存儲介質,用于提高臨床醫學短語與標準醫學短語之間的匹配效率,提高匹配模型在真實臨床數據場景下的適應性。
本發明實施例的第一方面提供一種醫學短語匹配方法,包括:獲取待識別短語,所述待識別短語包括多個醫學實體;在預置的醫學文本庫中確定與所述待識別短語相關的標準醫學短語集,所述標準醫學短語集包括多個標準醫學短語;將所述待識別短語與所述多個標準醫學短語進行拼接,得到多個待識別醫學語句;將所述多個待識別醫學語句分別輸入訓練好的BERT模型中,生成多個待識別醫學語句向量;根據所述多個待識別醫學語句向量生成多個相似度;比較所述多個相似度的取值大小,確定取值最大的目標相似度,并根據所述目標相似度確定與所述待識別短語匹配的標準醫學短語。
可選的,在本發明實施例第一方面的第一種實現方式中,所述在預置的醫學文本庫中確定與所述待識別短語相關的標準醫學短語集,所述標準醫學短語集包括多個標準醫學短語,包括:確定所述待識別短語中每個醫學實體對應的實體類型和所屬的目標醫學類別;在所述預置的醫學文本庫中抽取所述目標醫學類別中全部候選醫學詞語,得到目標類別醫學詞語;在所述目標類別醫學詞語中選擇與所述實體類型對應的待選擇醫學詞語,確定多個標準醫學短語,得到標準醫學短語集。
可選的,在本發明實施例第一方面的第二種實現方式中,所述將所述待識別短語與所述多個標準醫學短語進行拼接,得到多個待識別醫學語句,包括:對所述多個標準醫學短語中的標準醫學短語進行排序,得到多個待拼接醫學短語和對應的排列順序;按照所述對應的排列順序依次將所述多個待拼接醫學短語與所述待識別短語進行連接,得到多個拼接的醫學語句;在每個拼接的醫學語句中加入起始符號和分隔符號,生成多個待識別醫學語句。
可選的,在本發明實施例第一方面的第三種實現方式中,所述將所述多個待識別醫學語句分別輸入訓練好的BERT模型中,生成多個待識別醫學語句向量,包括:將所述多個待識別醫學語句分別輸入訓練好的BERT模型的transformer層中,生成多個待處理醫學語句向量;通過所述訓練好的BERT模型的池化層對所述多個待識別醫學語句進行實體識別,得到多個字向量;將所述多個字向量分別與每個待處理醫學語句向量進行求和并取均值,生成多個待識別醫學語句向量。
可選的,在本發明實施例第一方面的第四種實現方式中,在所述獲取待識別短語,所述待識別短語包括多個醫學實體之前,所述醫學短語匹配方法還包括:對初始改進的BERT模型進行訓練,得到訓練好的BERT模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳平安醫療健康科技服務有限公司,未經深圳平安醫療健康科技服務有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011386028.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:多層預制基板及其壓合工藝
- 下一篇:一種基于同軸線纜的5G信號傳輸系統





