[發明專利]基于大模型提升臨床試驗受試者匹配精度的方法和系統在審
| 申請號: | 202310901710.0 | 申請日: | 2023-07-21 |
| 公開(公告)號: | CN116646041A | 公開(公告)日: | 2023-08-25 |
| 發明(設計)人: | 張奇;蘇志鵠;李麗 | 申請(專利權)人: | 北京惠每云科技有限公司 |
| 主分類號: | G16H10/20 | 分類號: | G16H10/20;G06F16/35;G06F40/295 |
| 代理公司: | 成都拓荒者知識產權代理有限公司 51254 | 代理人: | 鄒廣春 |
| 地址: | 100000 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 模型 提升 臨床試驗 受試者 匹配 精度 方法 系統 | ||
本申請涉及一種基于大模型提升臨床試驗受試者匹配精度的方法和系統,應用于大模型的技術領域,其包括獲取醫學文本信息;構建醫學領域大語言模型;通過所述醫學領域大語言模型對醫學文本信息進行提取并獲取專病數據集;通過預設的項目納排標準對專病數據集匹配對應的臨床試驗項目,所述項目納排標準包括不同的臨床試驗項目以及對應的納排標準。本申請具有通過效果更好的大語言模型提取醫學實體及實體關系,相比較傳統機器學習模型,能夠顯著提升實體識別的召回率和準確率的效果。
技術領域
本申請涉及大模型的技術領域,尤其是涉及一種基于大模型提升臨床試驗受試者匹配精度的方法和系統。
背景技術
臨床試驗項目是為了評估藥物、醫療器械等醫療產品的療效、安全性和適應癥而進行的研究。
現有的臨床試驗項目選擇通常包括以下步驟:獲取臨床試驗項目的入排標準文本,并抽取入排標準數據,其中,入排標準數據包括實體、屬性以及實體-屬性對應關系;將所述入排標準數據展示至規則配置界面;響應于對所述規則配置界面的規則配置操作,生成入排規則;基于所述入排規則和受試者病程信息的匹配結果,為受試者推薦臨床試驗項目。
針對上述的相關技術,發明人認為基于傳統的機器學習,抽取醫學實體和實體關系,準確率不高。
發明內容
為了改善現有的基于傳統的機器學習,抽取醫學實體和實體關系,準確率不高的問題,本申請提供一種基于大模型提升臨床試驗受試者匹配精度的方法和系統。
根據本發明的第一方面,提供了一種基于大模型提升臨床試驗受試者匹配精度的方法,此方法包括以下步驟:
獲取醫學文本信息;
構建醫學領域大語言模型;
通過所述醫學領域大語言模型對醫學文本信息進行提取并獲取專病數據集;
通過預設的項目納排標準對專病數據集匹配對應的臨床試驗項目,所述項目納排標準包括不同的臨床試驗項目以及對應的納排標準。
在一個具體的可實施方案中,所述構建醫學領域大語言模型包括;
獲取醫學文本數據;
提取醫學文本關鍵詞;
根據醫學文本關鍵詞查詢對應的醫學領域大模型;
訓練醫學領域大模型;
構建醫學領域大語言模型。
在一個具體的可實施方案中,所述構建醫學領域大語言模型包括:
查詢不同的醫學領域大語言模型對應的效果并進行評估;
根據評估結果選擇精準度達標的醫學領域大語言模型并進行融合操作;
若融合后的醫學領域大語言模型的精準度大于融合前的任一醫學領域大語言模型,則將融合后的醫學領域大語言模型設置為構建醫學領域大語言模型。
在一個具體的可實施方案中,所述提取醫學文本關鍵詞包括:
將醫學文本關鍵詞進行分類獲得實體文本和關系文本;
所述實體文本識別具體包括如下步驟:
識別實體文本中的醫學概念;
抽取實體文本中的醫學關鍵信息;
輸出已選關鍵信息至關系文本中。
在一個具體的可實施方案中,在所述將醫學文本關鍵詞進行分類獲得實體文本和關系文本之后,還包括:
判斷不同醫學關鍵信息之間的關聯關系;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京惠每云科技有限公司,未經北京惠每云科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310901710.0/2.html,轉載請聲明來源鉆瓜專利網。





