[發(fā)明專利]中文電子病歷手術(shù)操作文本的ICD自動(dòng)編碼方法及裝置在審
| 申請(qǐng)?zhí)枺?/td> | 202111373822.0 | 申請(qǐng)日: | 2021-11-19 |
| 公開(公告)號(hào): | CN114065744A | 公開(公告)日: | 2022-02-18 |
| 發(fā)明(設(shè)計(jì))人: | 傅湘玲;高越;閆晨巍 | 申請(qǐng)(專利權(quán))人: | 北京郵電大學(xué) |
| 主分類號(hào): | G06F40/258 | 分類號(hào): | G06F40/258;G06F40/30;G06N3/02;G06N3/08;G16H10/60;G06F16/35;G06F16/33 |
| 代理公司: | 北京格允知識(shí)產(chǎn)權(quán)代理有限公司 11609 | 代理人: | 張莉瑜 |
| 地址: | 100876 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 中文 電子 病歷 手術(shù) 操作 文本 icd 自動(dòng) 編碼 方法 裝置 | ||
1.一種中文電子病歷手術(shù)操作文本的ICD自動(dòng)編碼方法,其特征在于,包括:
以結(jié)構(gòu)化電子病歷中的手術(shù)操作文本作為輸入,基于BERT無監(jiān)督預(yù)訓(xùn)練模型,構(gòu)建包含無監(jiān)督上下文語義信息的節(jié)點(diǎn)與邊,得到每條手術(shù)操作文本的無監(jiān)督語義圖;其中,所述無監(jiān)督語義圖的節(jié)點(diǎn)包括章節(jié)級(jí)節(jié)點(diǎn)、文檔級(jí)節(jié)點(diǎn)和最多四個(gè)軸心詞節(jié)點(diǎn);所述章節(jié)級(jí)節(jié)點(diǎn)的特征向量包含手術(shù)操作文本所屬章節(jié)的上下文語義信息,所述文檔級(jí)節(jié)點(diǎn)的特征向量包含整條手術(shù)操作文本的上下文語義信息,四個(gè)所述軸心詞節(jié)點(diǎn)的特征向量分別包含手術(shù)操作的部位、術(shù)式、入路和疾病性質(zhì)四個(gè)軸心詞語義信息,所述無監(jiān)督語義圖的邊的權(quán)重包含所連兩節(jié)點(diǎn)之間在手術(shù)操作文本中的的語義影響力信息;
將構(gòu)建的所述無監(jiān)督語義圖輸入門控圖神經(jīng)網(wǎng)絡(luò),進(jìn)行全局信息交互,得到語義信息融合的語義圖;
基于得到的語義信息融合的語義圖,聚合各節(jié)點(diǎn)的表征,得到聚合的特征向量;
根據(jù)聚合的特征向量進(jìn)行分類,確定所述手術(shù)操作文本對(duì)應(yīng)的ICD編碼。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述基于BERT無監(jiān)督預(yù)訓(xùn)練模型,構(gòu)建包含無監(jiān)督上下文語義信息的節(jié)點(diǎn),包括:
將所述手術(shù)操作文本輸入第一BERT模型,查找所述手術(shù)操作文本對(duì)應(yīng)的編碼章節(jié),確定章節(jié)標(biāo)題文本;所述第一BERT模型包括BERT無監(jiān)督預(yù)訓(xùn)練模型和softmax層;
將所述章節(jié)標(biāo)題文本輸入第二BERT模型,以[CLS]字符的表征作為所述章節(jié)級(jí)節(jié)點(diǎn)的初始特征向量;
將所述手術(shù)操作文本輸入命名實(shí)體識(shí)別模型,分別提取部位、術(shù)式、入路和疾病性質(zhì)四個(gè)軸心詞的詞組,確定各軸心詞的詞組位置;
將所述手術(shù)操作文本輸入第二BERT模型,以[CLS]字符的表征作為所述文檔級(jí)節(jié)點(diǎn)的初始特征向量,分別以各軸心詞詞組所涉及字符的表征的平均值,作為相應(yīng)軸心詞節(jié)點(diǎn)的初始特征向量。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述基于BERT無監(jiān)督預(yù)訓(xùn)練模型,構(gòu)建包含無監(jiān)督上下文語義信息的邊,包括:
計(jì)算每兩個(gè)所述軸心詞節(jié)點(diǎn)之間有指向性的影響力關(guān)系;
計(jì)算各所述軸心詞節(jié)點(diǎn)與所述文檔級(jí)節(jié)點(diǎn)之間有指向性的影響力關(guān)系;
計(jì)算所述章節(jié)級(jí)節(jié)點(diǎn)與所述文檔級(jí)節(jié)點(diǎn)之間有指向性的影響力關(guān)系;
基于影響力關(guān)系構(gòu)造影響力矩陣,利用激活函數(shù)將構(gòu)造的所述影響力矩陣轉(zhuǎn)換為歸一化的鄰接矩陣,確定所述無監(jiān)督語義圖中各邊的權(quán)重。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,計(jì)算兩個(gè)所述軸心詞節(jié)點(diǎn)之間有指向性的影響力關(guān)系,包括:
設(shè)兩個(gè)軸心詞節(jié)點(diǎn)分別為第一軸心詞節(jié)點(diǎn)和第二軸心詞節(jié)點(diǎn),用[MASK]字符遮擋所述手術(shù)操作文本中第一軸心詞節(jié)點(diǎn)對(duì)應(yīng)的詞組,輸入第二BERT模型,得到該第一軸心詞節(jié)點(diǎn)對(duì)應(yīng)的詞組所涉及字符的表征的平均值,作為第一平均值;
用[MASK]字符遮擋所述手術(shù)操作文本中第一軸心詞節(jié)點(diǎn)和第二軸心詞節(jié)點(diǎn)對(duì)應(yīng)的詞組,輸入第二BERT模型,得到該第一軸心詞節(jié)點(diǎn)對(duì)應(yīng)的詞組所涉及字符的表征的平均值,作為第二平均值;
基于歐幾里得距離,計(jì)算所述第一平均值與所述第二平均值之間的差異,作為第二軸心詞節(jié)點(diǎn)對(duì)第一軸心詞節(jié)點(diǎn)的影響力權(quán)重。
5.根據(jù)權(quán)利要求3所述的方法,其特征在于,計(jì)算所述軸心詞節(jié)點(diǎn)與所述文檔級(jí)節(jié)點(diǎn)之間有指向性的影響力關(guān)系,包括:
用[MASK]字符遮擋所述手術(shù)操作文本中該軸心詞節(jié)點(diǎn)對(duì)應(yīng)的詞組,輸入第二BERT模型,以[CLS]字符的表征作為第二文檔參量,以該軸心詞節(jié)點(diǎn)對(duì)應(yīng)的詞組所涉及字符的表征的平均值,作為第二軸心詞參量;
以所述文檔級(jí)節(jié)點(diǎn)的初始特征向量作為第一文檔參量,基于歐幾里得距離,計(jì)算所述第一文檔參量與所述第二文檔參量之間的差異,作為該軸心詞節(jié)點(diǎn)對(duì)所述文檔級(jí)節(jié)點(diǎn)的影響力權(quán)重;
以該軸心詞節(jié)點(diǎn)的初始特征向量作為第一軸心詞參量,基于歐幾里得距離,計(jì)算所述第一軸心詞參量與所述第二軸心詞參量之間的差異,作為所述文檔級(jí)節(jié)點(diǎn)對(duì)該軸心詞節(jié)點(diǎn)的影響力權(quán)重。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京郵電大學(xué),未經(jīng)北京郵電大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111373822.0/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 一種在多種電子設(shè)備,尤其是在電子服務(wù)提供商的電子設(shè)備和電子服務(wù)用戶的電子設(shè)備之間建立受保護(hù)的電子通信的方法
- 一種電子打火機(jī)及其裝配方法
- 電子檔案管理系統(tǒng)
- 在處理系統(tǒng)化學(xué)分析中使用的電子束激勵(lì)器
- 電子文件管理方法和管理系統(tǒng)
- 一種有效電子憑據(jù)生成、公開驗(yàn)證方法、裝置及系統(tǒng)
- 電子文憑讀寫控制系統(tǒng)和方法
- 具有加密解密功能的智能化電子證件管理裝置
- 一種基于數(shù)字證書的電子印章方法及電子印章系統(tǒng)
- 一種電子印章使用方法、裝置及電子設(shè)備
- 一種基于網(wǎng)絡(luò)的病歷資料存儲(chǔ)流轉(zhuǎn)方法及系統(tǒng)
- 一種高效查找病歷夾的病歷夾和病歷車系統(tǒng)
- 電子病歷的質(zhì)檢方法、相似病歷的提醒方法及裝置
- 電子病歷的生成方法及裝置
- 用于輸出病歷的方法和裝置
- 相似病歷查找方法及系統(tǒng)
- 一種生成診前病歷的方法及裝置
- 一種基于標(biāo)準(zhǔn)數(shù)據(jù)庫的電子病歷模板配置系統(tǒng)
- 基于動(dòng)態(tài)病情的病歷分組方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于科室流程化工作的全生命周期結(jié)構(gòu)化電子病歷系統(tǒng)





