[發(fā)明專利]一種臨床術(shù)語標(biāo)準(zhǔn)化的數(shù)量預(yù)測方法及裝置在審
| 申請?zhí)枺?/td> | 202110264867.8 | 申請日: | 2021-03-12 |
| 公開(公告)號: | CN112836055A | 公開(公告)日: | 2021-05-25 |
| 發(fā)明(設(shè)計)人: | 李雪;劉升平;梁家恩 | 申請(專利權(quán))人: | 云知聲智能科技股份有限公司;廈門云知芯智能科技有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/289;G16H50/70 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100096 北京市海*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 臨床 術(shù)語 標(biāo)準(zhǔn)化 數(shù)量 預(yù)測 方法 裝置 | ||
1.一種臨床術(shù)語標(biāo)準(zhǔn)化的數(shù)量預(yù)測方法,其特征在于,所述方法包括:
獲取基本數(shù)據(jù)集;所述基本數(shù)據(jù)集包括多個臨床術(shù)語和每個臨床術(shù)語對應(yīng)的標(biāo)準(zhǔn)術(shù)語集合;
確定每個臨床術(shù)語對應(yīng)的標(biāo)準(zhǔn)術(shù)語集合的分類標(biāo)簽;
對每個標(biāo)準(zhǔn)術(shù)語集合進行增強,確定增強數(shù)據(jù)集;
根據(jù)所述分類標(biāo)簽和所述增強數(shù)據(jù)集,通過預(yù)訓(xùn)練語言模型BERT進行微調(diào),確定臨床術(shù)語標(biāo)準(zhǔn)化的數(shù)量。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取基本數(shù)據(jù)集具體包括:
通過開源術(shù)語標(biāo)準(zhǔn)化競賽或者網(wǎng)絡(luò)爬取獲取基本數(shù)據(jù)集。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述確定每個臨床術(shù)語對應(yīng)的標(biāo)準(zhǔn)術(shù)語集合的分類標(biāo)簽具體包括:
利用公式K=maxi∈(1,n)Card(Yi)確定分類標(biāo)簽;其中,分類標(biāo)簽為1到K的整數(shù),K為每個臨床術(shù)語對應(yīng)的標(biāo)準(zhǔn)術(shù)語集合中的標(biāo)準(zhǔn)術(shù)語數(shù)量的最大值,n為臨床術(shù)語的數(shù)量;基本數(shù)據(jù)集為D{X1,X2,...,Xn;Y1,Y2,...,Yn},Xi表示臨床術(shù)語,Yi為Xi對應(yīng)的標(biāo)準(zhǔn)術(shù)語集合{yi1,yi2,...,yik}。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對每個標(biāo)準(zhǔn)術(shù)語集合進行增強,確定增強數(shù)據(jù)集具體包括:
對所述標(biāo)準(zhǔn)術(shù)語集合進行挖掘,確定所述標(biāo)準(zhǔn)術(shù)語集合中可合并的標(biāo)準(zhǔn)術(shù)語;對所述可合并的標(biāo)準(zhǔn)術(shù)語進行合并,確定合并后的標(biāo)準(zhǔn)術(shù)語為標(biāo)準(zhǔn)術(shù)語增強集;并且,
當(dāng)臨床術(shù)語中存在分隔符時,將存在分隔符的所述臨床術(shù)語對應(yīng)的標(biāo)準(zhǔn)術(shù)語集合進行擴充,將擴充后的標(biāo)準(zhǔn)術(shù)語集合確定為基本數(shù)據(jù)增強集;并且,
根據(jù)所述基本數(shù)據(jù)集、所述標(biāo)準(zhǔn)術(shù)語增強集和所述基本數(shù)據(jù)增強集,統(tǒng)計每個臨床術(shù)語中的分隔符,并確定存在分隔符的臨床術(shù)語的概率,根據(jù)確定的存在分隔符的臨床術(shù)語的概率,確定分隔符增強數(shù)據(jù)集。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述根據(jù)所述分類標(biāo)簽和所述增強數(shù)據(jù)集,通過預(yù)訓(xùn)練語言模型BERT進行微調(diào),確定臨床術(shù)語標(biāo)準(zhǔn)化的數(shù)量具體包括:
根據(jù)所述基本數(shù)據(jù)集、所述標(biāo)準(zhǔn)術(shù)語增強集、所述基本數(shù)據(jù)增強集、和所述分隔符數(shù)據(jù)增強集和所述分類標(biāo)簽,通過預(yù)訓(xùn)練語言模型BERT進行預(yù)測,得到臨床術(shù)語標(biāo)準(zhǔn)化的數(shù)量。
6.一種臨床術(shù)語標(biāo)準(zhǔn)化的數(shù)量預(yù)測裝置,其特征在于,所述裝置包括:
獲取單元,所述獲取單元用于獲取基本數(shù)據(jù)集;所述基本數(shù)據(jù)集包括多個臨床術(shù)語和每個臨床術(shù)語對應(yīng)的標(biāo)準(zhǔn)術(shù)語集合;
確定單元,所述確定單元用于確定每個臨床術(shù)語對應(yīng)的標(biāo)準(zhǔn)術(shù)語集合的分類標(biāo)簽;
所述確定單元還用于對每個標(biāo)準(zhǔn)術(shù)語集合進行增強,確定增強數(shù)據(jù)集;
所述確定單元還用于根據(jù)所述分類標(biāo)簽和所述增強數(shù)據(jù)集,通過預(yù)訓(xùn)練語言模型BERT進行微調(diào),確定臨床術(shù)語標(biāo)準(zhǔn)化的數(shù)量。
7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述獲取單元具體用于:
通過開源術(shù)語標(biāo)準(zhǔn)化競賽或者網(wǎng)絡(luò)爬取獲取基本數(shù)據(jù)集。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于云知聲智能科技股份有限公司;廈門云知芯智能科技有限公司,未經(jīng)云知聲智能科技股份有限公司;廈門云知芯智能科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110264867.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 定量臨床和臨床前成像
- 用于管理臨床研究數(shù)據(jù)的機器和方法
- 用于臨床歷史片斷的迭代構(gòu)建的系統(tǒng)和方法
- 一種臨床事件存儲方法及裝置
- 用于基于語義關(guān)系來將自由文本臨床文檔建模為層次圖狀數(shù)據(jù)結(jié)構(gòu)的系統(tǒng)和方法
- 一種基于Excel導(dǎo)入的臨床業(yè)務(wù)自動建庫方法
- 一種基于大數(shù)據(jù)技術(shù)的區(qū)域臨床路徑管理系統(tǒng)
- 一種臨床術(shù)語的管理方法及裝置、可讀存儲介質(zhì)
- 一種臨床數(shù)據(jù)管理方法
- 一種臨床藥物分類管理系統(tǒng)
- 一種領(lǐng)域術(shù)語抽取的方法
- 醫(yī)學(xué)術(shù)語識別方法及裝置
- 術(shù)語抽取方法和裝置
- 一種醫(yī)療術(shù)語知識庫完善的方法和裝置
- 一種構(gòu)建制造領(lǐng)域術(shù)語庫的方法及系統(tǒng)
- 術(shù)語更新方法以及相關(guān)設(shè)備、裝置
- 一種醫(yī)學(xué)術(shù)語系統(tǒng)的構(gòu)建方法、裝置、設(shè)備及存儲介質(zhì)
- 一種基于多特征的術(shù)語檢索方法
- 一種術(shù)語替換方法及系統(tǒng)
- 一種標(biāo)準(zhǔn)術(shù)語確定方法、裝置及存儲介質(zhì)
- 標(biāo)準(zhǔn)化單杠
- 標(biāo)準(zhǔn)化天線
- 通信系統(tǒng)、通信裝置
- 快速參數(shù)匹配電源濾波器組合體
- 數(shù)據(jù)需求標(biāo)準(zhǔn)化方法及標(biāo)準(zhǔn)化系統(tǒng)
- 一種測井曲線標(biāo)準(zhǔn)化方法及系統(tǒng)
- 一種警情標(biāo)準(zhǔn)化錄入系統(tǒng)
- 數(shù)據(jù)標(biāo)準(zhǔn)化方法、裝置以及電子設(shè)備
- 標(biāo)準(zhǔn)化設(shè)計平臺及標(biāo)準(zhǔn)化設(shè)計方法
- 標(biāo)準(zhǔn)化泵房





