[發明專利]一種自動生成診斷結果的方法、系統及計算機設備在審
| 申請號: | 201910594042.5 | 申請日: | 2019-07-03 |
| 公開(公告)號: | CN110322962A | 公開(公告)日: | 2019-10-11 |
| 發明(設計)人: | 雷大江;張莉萍;李智星;林智敏;陳浩;張玉楓;吳渝 | 申請(專利權)人: | 重慶郵電大學 |
| 主分類號: | G16H50/20 | 分類號: | G16H50/20;G06F16/33;G06F16/35;G16H10/60;G06K9/62 |
| 代理公司: | 重慶輝騰律師事務所 50215 | 代理人: | 盧勝斌 |
| 地址: | 400065 重*** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 診斷結果 預處理 卷積神經網絡 神經網絡結構 計算機設備 向量表示 自動生成 標簽 構建 語料 計算機技術領域 矩陣 神經網絡輸出 注意力機制 詞袋模型 分類概率 神經網絡 循環單元 傳統的 詞向量 雙向門 采集 沖突 | ||
1.一種自動生成診斷結果的方法,其特征在于,包括:
S1、采集病例的病史小結,并對病史小結進行預處理;
S2、將預處理后的語料構建預訓練詞向量模型Word2Vec,得到向量表示的語料;
S3、構建神經網絡結構,并將向量表示的預料輸入該神經網絡;該神經網絡結構包括雙向門控循環單元BiGRU、卷積神經網絡卷積神經網絡CNN和注意力機制Att;
S4、設置閾值來選擇神經網絡輸出的多分類概率矩陣中的標簽,選擇的標簽即為診斷結果。
2.根據權利要求1所述的一種自動生成診斷結果的方法,其特征在于,步驟S1包括:解析電子病例,按照字段解析并提取結構化信息,并將電子病歷信息轉化為結構化文本中的一條記錄;并對解析后的電子病例文本進行文本分詞、清除標點符號以及去除停用詞。
3.根據權利要求2所述的一種自動生成診斷結果的方法,其特征在于,采用pdfplumber電子病歷進行解析,將文本按照從上至下,從左至右的順序提取,并將解析后的pdf文本進行拼接,形成一個文本字符串。
4.根據權利要求1所述的一種自動生成診斷結果的方法,其特征在于,步驟S2包括:使用gensim庫的Word2vec模型,無監督訓練詞向量,把每個詞都用一個128維的向量表示。
5.根據權利要求1所述的一種自動生成診斷結果的方法,其特征在于,所述步驟3包括:
將文本的word2id傳入神經網絡的嵌入層,轉為詞向量矩陣;
使用雙向門控循環單元BiGRU提取上下文特征;
對于雙向門控循環單元BiGRU提取得到的特征用CNN卷積獲取局部信息,并采用最大和均值池化,減少特征維度;
對于雙向門控循環單元BiGRU提取到的特征采用Attention機制,給特定位置的信息賦予更高的權重。
6.根據權利要求1所述的一種自動生成診斷結果的方法,其特征在于,步驟S4中的閾值采用F1-score取值最大的值,F1-score表示為:
其中,F1為F1-score的值;P為神經網絡結構的精確率,R為神經網絡結構的召回率。
7.一種自動生成診斷結果的系統,其特征在于,所述包括數據采集模塊、數據預處理模塊、詞向量生成器、基于神經網絡的診斷結果生成器以及診斷結果選擇器;其中:
所述數據采集模塊用于采集病例中的病史小結;
所述數據預處理模塊用于對數據采集模塊采集的病史小結轉化為結構化文本中的一條記錄,并對該條記錄進行文本分詞、清除標點符號以及去除停用詞;
所述詞向量生成器用于使用gensim庫的Word2vec模型對預處理模塊輸出的文本進行無監督訓練詞向量,把每個詞都用一個128維的向量表示;
所述基于卷積神經網絡的診斷結果生成器用于對輸入的詞向量進行診斷預測;
所述診斷結果選擇器用于判斷基于基于神經網絡的診斷結果生成器輸出的多個診斷結果中選擇一個作為診斷結果。
8.根據權利要求7所述的一種自動生成診斷結果的系統,其特征在于,所述基于卷積神經網絡的診斷結果生成器包括嵌入單元、雙向門控循環單元、卷積神經網絡單元以及注意力機制單元;其中:
所述嵌入單元用于將輸入的詞向量轉化為詞向量矩陣;
所述雙向門控循環單元用于提取詞向量矩陣的上下文特征;
所述卷積神經網絡單元用于根據提取的上下文特征獲取局部信息,并采用最大和均值池化,減少特征維度;
所述注意力機制單元用于對特定位置的信息賦予更高的權重。
9.根據權利要求7所述的一種自動生成診斷結果的系統,其特征在于,所述診斷結果選擇器利用F1-score取值最大的值作為診斷結果。
10.一種自動生成診斷結果的計算機設備,其特征在于,包括存儲器、處理器以及儲存在存儲器上可以在處理器上運行的計算機程序,所述計算機程序實現權利要求1~6所述的任一方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶郵電大學,未經重慶郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910594042.5/1.html,轉載請聲明來源鉆瓜專利網。





