[發明專利]醫學數據標注方法、裝置、存儲介質及計算機設備有效
| 申請號: | 202010181144.7 | 申請日: | 2020-03-16 |
| 公開(公告)號: | CN111444686B | 公開(公告)日: | 2023-07-25 |
| 發明(設計)人: | 李然;沈宏;李蕊 | 申請(專利權)人: | 武漢中科醫療科技工業技術研究院有限公司 |
| 主分類號: | G06F40/169 | 分類號: | G06F40/169;G06F40/295;G06F40/284 |
| 代理公司: | 北京華進京聯知識產權代理有限公司 11606 | 代理人: | 孫巖 |
| 地址: | 430206 湖北省武漢市東湖新技*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 醫學 數據 標注 方法 裝置 存儲 介質 計算機 設備 | ||
本申請涉及一種醫學數據標注方法、裝置、存儲介質及計算機設備,在進行醫學數據標注時,在通過對醫學數據進行編碼處理得到最低粒度的數據對應的字向量之后,還包括對具備醫學相關性的相鄰數據對應的相鄰字向量進行組合處理的步驟,從而可以得到不同粒度任務級別的字向量組合,然后通過標注模型對字向量以及字向量組合進行標注,可以使得得到的醫學屬性類別標注結果包含不同粒度數據的標注結果,從而使得標注結果更全面,有利于電子病歷的數據挖掘分析。
技術領域
本申請涉及數據處理技術領域,特別是涉及一種醫學數據標注方法、裝置、存儲介質及計算機設備。
背景技術
隨著電子技術的發展,電子病歷在各大醫院的應用越來越普及,不同于傳統的紙質病歷,電子病歷便于儲存和管理。電子病歷一般存儲有病患的疾病癥狀、診斷經過等與臨床治療相關的重要信息,它與病患的健康有著緊密的聯系,因此對電子病歷的數據挖掘和分析在近年來受到了廣泛的關注,而命名實體識別(即識別電子病歷中的數據的醫學屬性類別,如發病部位、發病癥狀、治療手段等)的研究作為自然語言處理的一個重要的基礎任務,有著重要的意義。
現有技術中,通常使用網絡模型進行命名實體識別工作。用戶通過樣本數據對初始模型進行訓練,得到可以用于進行命名實體識別的網絡模型,然后通過該網絡模型對新的電子病歷進行識別標注。然而,現有技術在模型訓練時都只是針對命名實體識別任務進行訓練,得到的模型只能提取樣本實體粒度的信息,而無法有效提取樣本其他粒度的信息,如字符粒度,句子粒度,或者文本粒度的信息,從而使得標注結果不全面,不利于電子病歷的數據挖掘分析。
發明內容
基于此,有必要針對現有技術存在的問題,提供一種有助于提高標注結果的全面性的醫學數據標注方法、裝置、存儲介質及計算機設備。
一種醫學數據標注方法,包括:
獲取待標注的醫學數據以及預先訓練的標注模型;
對所述醫學數據進行編碼處理,得到所述醫學數據中最低粒度的數據對應的字向量,并對具備醫學相關性的相鄰數據對應的相鄰字向量進行組合處理,得到不同粒度的字向量組合;
通過所述標注模型對各所述字向量以及各所述字向量組合進行數據屬性類別標注,得到所述醫學數據的醫學屬性類別標注結果。
一種醫學數據標注裝置,包括:
獲取模塊,用于獲取待標注的醫學數據以及預先訓練的標注模型;
編碼模塊,用于對所述醫學數據進行編碼處理,得到所述醫學數據中最低粒度的數據對應的字向量,并對具備醫學相關性的相鄰數據對應的相鄰字向量進行組合處理,得到不同粒度的字向量組合;
標注模塊,用于通過所述標注模型對各所述字向量以及各所述字向量組合進行數據屬性類別標注,得到所述醫學數據的醫學屬性類別標注結果。
一種計算機設備,包括存儲器和處理器,所述存儲器存儲有計算機程序,所述處理器執行所述計算機程序時實現上述方法的步驟。
一種計算機可讀存儲介質,其上存儲有計算機程序,所述計算機程序被處理器執行時實現上述方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢中科醫療科技工業技術研究院有限公司,未經武漢中科醫療科技工業技術研究院有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010181144.7/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





