[發(fā)明專利]一種醫(yī)學(xué)實(shí)體詞的識(shí)別方法和裝置有效
| 申請(qǐng)?zhí)枺?/td> | 202110841311.0 | 申請(qǐng)日: | 2021-07-26 |
| 公開(公告)號(hào): | CN113297852B | 公開(公告)日: | 2021-11-12 |
| 發(fā)明(設(shè)計(jì))人: | 全福亮;李麗;張奇 | 申請(qǐng)(專利權(quán))人: | 北京惠每云科技有限公司 |
| 主分類號(hào): | G06F40/295 | 分類號(hào): | G06F40/295;G06F16/31 |
| 代理公司: | 北京超凡宏宇專利代理事務(wù)所(特殊普通合伙) 11463 | 代理人: | 畢翔宇 |
| 地址: | 100191 北京市海淀區(qū)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 醫(yī)學(xué) 實(shí)體詞 識(shí)別 方法 裝置 | ||
1.一種醫(yī)學(xué)實(shí)體詞的識(shí)別方法,其特征在于,包括:
構(gòu)建用于表征醫(yī)學(xué)實(shí)體詞與自編碼向量之間對(duì)應(yīng)關(guān)系的預(yù)訓(xùn)練模型;
利用二分類模型針對(duì)所構(gòu)建的預(yù)訓(xùn)練模型的輸出結(jié)果進(jìn)行識(shí)別,并基于識(shí)別結(jié)果對(duì)所述預(yù)訓(xùn)練模型進(jìn)行微調(diào),以生成標(biāo)準(zhǔn)詞自編碼模型;
提取目標(biāo)病例文本中的目標(biāo)醫(yī)學(xué)實(shí)體詞的內(nèi)容特征;
將所述內(nèi)容特征輸入所述標(biāo)準(zhǔn)詞自編碼模型,獲得目標(biāo)醫(yī)學(xué)實(shí)體詞對(duì)應(yīng)的第一自編碼向量,所述第一自編碼向量為所述醫(yī)學(xué)實(shí)體詞的語義表征向量;
從醫(yī)學(xué)標(biāo)準(zhǔn)詞編碼索引庫中查找與第一自編碼向量對(duì)應(yīng)的醫(yī)學(xué)標(biāo)準(zhǔn)詞,具體包括:所述醫(yī)學(xué)標(biāo)準(zhǔn)詞編碼索引庫存儲(chǔ)有醫(yī)學(xué)標(biāo)準(zhǔn)詞以及與醫(yī)學(xué)標(biāo)準(zhǔn)詞對(duì)應(yīng)的自編碼向量,計(jì)算第一自編碼向量與醫(yī)學(xué)標(biāo)準(zhǔn)詞編碼索引庫中所存儲(chǔ)的各自編碼向量的相似度,將相似度最高的自編碼向量所對(duì)應(yīng)的醫(yī)學(xué)標(biāo)準(zhǔn)詞確定為與第一自編碼向量對(duì)應(yīng)的醫(yī)學(xué)標(biāo)準(zhǔn)詞;
將所述醫(yī)學(xué)標(biāo)準(zhǔn)詞作為所述目標(biāo)醫(yī)學(xué)實(shí)體詞對(duì)應(yīng)的目標(biāo)醫(yī)學(xué)標(biāo)準(zhǔn)詞;
所述內(nèi)容特征包括:字向量、聲調(diào)向量、詞性向量和位置向量,
其中,將所述內(nèi)容特征輸入所述標(biāo)準(zhǔn)詞自編碼模型的步驟包括:
將字向量、聲調(diào)向量、詞性向量和位置向量按照預(yù)設(shè)的排列順序輸入所述標(biāo)準(zhǔn)詞自編碼模型,其中,所述排列順序?yàn)閺淖窒蛄俊⒙曊{(diào)向量、詞性向量到位置向量的順序。
2.根據(jù)權(quán)利要求1所述的識(shí)別方法,其特征在于,所述二分類模型是利用正訓(xùn)練樣本和負(fù)訓(xùn)練樣本訓(xùn)練得到的,
其中,所述正訓(xùn)練樣本通過以下方式獲得:
從醫(yī)學(xué)標(biāo)準(zhǔn)詞庫中查找與病歷文本中的醫(yī)學(xué)實(shí)體詞的醫(yī)學(xué)意義相同的第一醫(yī)學(xué)標(biāo)準(zhǔn)詞;
建立病例文本中的醫(yī)學(xué)實(shí)體詞與第一醫(yī)學(xué)標(biāo)準(zhǔn)詞之間的第一映射關(guān)系,以生成標(biāo)準(zhǔn)數(shù)據(jù)對(duì);
基于所述標(biāo)準(zhǔn)數(shù)據(jù)對(duì)形成正訓(xùn)練樣本;
其中,所述負(fù)訓(xùn)練樣本通過以下方式獲得:
從醫(yī)學(xué)標(biāo)準(zhǔn)詞庫中查找與病歷文本中的醫(yī)學(xué)實(shí)體詞的醫(yī)學(xué)意義相近但詞意不同的第二醫(yī)學(xué)標(biāo)準(zhǔn)詞;
建立病例文本中的醫(yī)學(xué)實(shí)體詞與第二醫(yī)學(xué)標(biāo)準(zhǔn)詞之間的第二映射關(guān)系,以生成標(biāo)記數(shù)據(jù)對(duì);
基于所述標(biāo)記數(shù)據(jù)對(duì)形成負(fù)訓(xùn)練樣本。
3.根據(jù)權(quán)利要求2所述的識(shí)別方法,其特征在于,利用二分類模型針對(duì)所構(gòu)建的預(yù)訓(xùn)練模型的輸出結(jié)果進(jìn)行識(shí)別,并基于識(shí)別結(jié)果對(duì)所述預(yù)訓(xùn)練模型進(jìn)行微調(diào),以生成標(biāo)準(zhǔn)詞自編碼模型的步驟包括:
將全量的醫(yī)學(xué)標(biāo)準(zhǔn)詞的內(nèi)容特征輸入預(yù)訓(xùn)練模型,以輸出醫(yī)學(xué)標(biāo)準(zhǔn)詞對(duì)應(yīng)的第二自編碼向量;
將所述第二自編碼向量輸入所述二分類模型的池化層,以輸出分類結(jié)果;
根據(jù)輸出的所述分類結(jié)果調(diào)節(jié)所述預(yù)訓(xùn)練模型的模型參數(shù),以生成標(biāo)準(zhǔn)詞自編碼模型。
4.根據(jù)權(quán)利要求1所述的識(shí)別方法,其特征在于,
所述醫(yī)學(xué)標(biāo)準(zhǔn)詞編碼索引庫通過以下方式構(gòu)建:
提取全量的醫(yī)學(xué)標(biāo)準(zhǔn)詞的內(nèi)容特征;
將所提取的內(nèi)容特征分別輸入標(biāo)準(zhǔn)詞自編碼模型,獲得每個(gè)醫(yī)學(xué)標(biāo)準(zhǔn)詞對(duì)應(yīng)的自編碼向量;
基于醫(yī)學(xué)標(biāo)準(zhǔn)詞以及與醫(yī)學(xué)標(biāo)準(zhǔn)詞對(duì)應(yīng)的自編碼向量構(gòu)建醫(yī)學(xué)標(biāo)準(zhǔn)詞編碼索引庫。
5.根據(jù)權(quán)利要求1所述的識(shí)別方法,其特征在于,利用如下公式來計(jì)算目標(biāo)醫(yī)學(xué)實(shí)體詞對(duì)應(yīng)的第一自編碼向量與醫(yī)學(xué)標(biāo)準(zhǔn)詞編碼索引庫中的醫(yī)學(xué)標(biāo)準(zhǔn)詞的自編碼向量的相似度:
其中,為目標(biāo)醫(yī)學(xué)實(shí)體詞對(duì)應(yīng)的第一自編碼向量與醫(yī)學(xué)標(biāo)準(zhǔn)詞編碼索引庫中的醫(yī)學(xué)標(biāo)準(zhǔn)詞的自編碼向量的相似度,為醫(yī)學(xué)標(biāo)準(zhǔn)詞編碼索引庫中的醫(yī)學(xué)標(biāo)準(zhǔn)詞的自編碼向量,為目標(biāo)醫(yī)學(xué)實(shí)體詞對(duì)應(yīng)的第一自編碼向量,,n為自編碼向量的總維度。
6.根據(jù)權(quán)利要求1所述的識(shí)別方法,其特征在于,通過以下方式獲得目標(biāo)醫(yī)學(xué)實(shí)體詞:
接收請(qǐng)求端發(fā)送的攜帶有目標(biāo)醫(yī)學(xué)實(shí)體詞的識(shí)別請(qǐng)求;
從所述識(shí)別請(qǐng)求中提取所述目標(biāo)醫(yī)學(xué)實(shí)體詞;
其中,所述識(shí)別方法還包括:
向請(qǐng)求端反饋針對(duì)識(shí)別請(qǐng)求的應(yīng)答信息,所述應(yīng)答信息中攜帶有與目標(biāo)醫(yī)學(xué)實(shí)體詞對(duì)應(yīng)的目標(biāo)醫(yī)學(xué)標(biāo)準(zhǔn)詞,以使請(qǐng)求端將所述目標(biāo)醫(yī)學(xué)標(biāo)準(zhǔn)詞作為標(biāo)注詞添加到目標(biāo)病歷文本中來對(duì)目標(biāo)醫(yī)學(xué)實(shí)體詞進(jìn)行標(biāo)注。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京惠每云科技有限公司,未經(jīng)北京惠每云科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110841311.0/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 將醫(yī)學(xué)設(shè)備自動(dòng)整合到醫(yī)學(xué)設(shè)施網(wǎng)絡(luò)的方法和設(shè)備
- 醫(yī)學(xué)詢問細(xì)化系統(tǒng)、方法、裝置及包括醫(yī)學(xué)詢問系統(tǒng)的工作站
- 將醫(yī)學(xué)設(shè)備自動(dòng)整合到醫(yī)學(xué)設(shè)施網(wǎng)絡(luò)的方法和設(shè)備
- 基于人工智能的醫(yī)學(xué)影像分類處理系統(tǒng)及方法
- 一種醫(yī)學(xué)圖像系統(tǒng)
- 醫(yī)學(xué)知識(shí)圖譜構(gòu)建方法及裝置、存儲(chǔ)介質(zhì)和電子設(shè)備
- 一種實(shí)現(xiàn)醫(yī)學(xué)編碼映射的方法、裝置及設(shè)備
- 醫(yī)學(xué)影像的分類方法、醫(yī)學(xué)影像的檢索方法和裝置
- 一種醫(yī)學(xué)圖像處理方法、醫(yī)學(xué)圖像識(shí)別方法及裝置
- 醫(yī)學(xué)圖像標(biāo)記方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種修正實(shí)體詞識(shí)別的方法和裝置
- 實(shí)體詞的熱度獲取方法及裝置
- 文本的查重方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 實(shí)體詞識(shí)別結(jié)果評(píng)價(jià)方法、裝置、設(shè)備及實(shí)體詞提取系統(tǒng)
- 用于輸出信息的方法和裝置
- 詞向量的生成方法、裝置
- 實(shí)體詞識(shí)別方法和裝置
- 一種問診信息的實(shí)體抽取方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 商品搜索數(shù)據(jù)處理方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種實(shí)體關(guān)系聯(lián)合抽取方法及裝置
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測試終端的測試方法
- 一種服裝用人體測量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





