[發明專利]一種基于知識圖譜的電子病歷問答方法及系統在審
| 申請號: | 202010047420.0 | 申請日: | 2020-01-16 |
| 公開(公告)號: | CN111274373A | 公開(公告)日: | 2020-06-12 |
| 發明(設計)人: | 崔立真;柏欣雨;何偉;鹿旭東;郭偉 | 申請(專利權)人: | 山東大學 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/36;G16H10/60 |
| 代理公司: | 濟南圣達知識產權代理有限公司 37221 | 代理人: | 李琳 |
| 地址: | 250100 山*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 知識 圖譜 電子 病歷 問答 方法 系統 | ||
1.一種基于知識圖譜的電子病歷問答方法,其特征在于,包括:
構建基于電子病歷數據的知識圖譜,根據歷史問題查詢信息,統計關鍵詞的種類和數量,構建提問語句模板;
對獲取的問句進行基于字的標注和字的嵌入,以問句中每個字的字嵌入向量構成句子表示矩陣,對句子表示矩陣使用雙向長短期記憶模型和條件隨機場進行序列標注,輸出詞標注結果和其對應的標簽;
將詞標注結果和其對應的標簽與提問語句模板進行匹配,得到SPARQL語句生成模板,將標注的詞語和其對應的標簽填入SPARQL語句生成模板中,生成SPARQL查詢語句;
將SPARQL查詢語句輸入知識圖譜中進行查詢,得到答案。
2.如權利要求1所述的一種基于知識圖譜的電子病歷問答方法,其特征在于,
將電子病歷構建成基于資源描述框架的數據表示模型的知識圖譜,以患者、疾病、藥物、化驗、就診、治療和檢查字段作為知識圖譜的主體,以描述事件主客體關系和時序關系作為知識圖譜的屬性,以知識圖譜中主體和屬性關系作為基本的模式描述數據之間的關系。
3.如權利要求1所述的一種基于知識圖譜的電子病歷問答方法,其特征在于,所述構建提問語句模版,通過分析歷史問題的內容對其進行關鍵詞標注,統計關鍵詞的種類和數量,構建提問語句模版;
根據知識圖譜中主體和屬性關系,對獲取的問句采用BIO標注法進行基于字的標注。
4.如權利要求1所述的一種基于知識圖譜的電子病歷問答方法,其特征在于,對獲取的問句進行字的嵌入過程包括:
將問句進行字符級別分割后訓練word2vec模型,利用訓練好的word2vec模型將問句轉化為文本向量,計算問句中每個字的字嵌入向量。
5.如權利要求1所述的一種基于知識圖譜的電子病歷問答方法,其特征在于,對句子表示矩陣使用雙向長短期記憶模型包括:
句子表示矩陣經過前向LSTM后,每個字符所在的位置得到融合上文信息的隱藏層表示向量;經過后向LSTM后,每個字符所在的位置得到融合下文信息的隱藏層表示向量;將上文和下文信息的隱藏層表示向量進行拼接,每個字符得到融合上下文的表示向量。
6.如權利要求1所述的一種基于知識圖譜的電子病歷問答方法,其特征在于,使用條件隨機場包括:
對融合上下文的表示向量,根據問句中的順序組成序列,使用條件隨機場從所有可能的標簽序列中選取概率最高的序列中的詞標注結果作為輸出。
7.如權利要求6所述的一種基于知識圖譜的電子病歷問答方法,其特征在于,使用條件隨機場具體包括:
獲取需要學習的標簽轉移概率矩陣,通過模型預測序列標簽,得到預測某一標簽路徑分數;
通過Softmax函數對標簽路徑分數進行歸一化,得到預測該標簽路徑的概率值;
基于極大似然估計法,使標簽路徑概率最大化;根據維特比算法,從所有路徑中選擇概率值最高的作為最佳路徑輸出。
8.一種基于知識圖譜的電子病歷問答系統,其特征在于,包括:
知識圖譜和提問語句模板構建模塊,被配置為構建基于電子病歷數據的知識圖譜,根據歷史問題查詢信息,統計關鍵詞的種類和數量,構建提問語句模板;
字的標注和嵌入模塊,被配置為對獲取的問句進行基于字的標注和字的嵌入,以問句中每個字的字嵌入向量構成句子表示矩陣,對句子表示矩陣使用雙向長短期記憶模型和條件隨機場進行序列標注,輸出詞標注結果和其對應的標簽;
查詢語言生成模塊,被配置為將詞標注結果和其對應的標簽與提問語句模板進行匹配,得到SPARQL語句生成模板,將標注的詞語和其對應的標簽填入SPARQL語句生成模板中,生成SPARQL查詢語句;
查詢模塊,被配置為將SPARQL查詢語句輸入知識圖譜中進行查詢,得到答案。
9.一種電子設備,其特征是,包括存儲器和處理器以及存儲在存儲器上并在處理器上運行的計算機指令,所述計算機指令被處理器運行時,完成權利要求1-7任一項方法所述的步驟。
10.一種計算機可讀存儲介質,其特征是,用于存儲計算機指令,所述計算機指令被處理器執行時,完成權利要求1-7任一項方法所述的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山東大學,未經山東大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010047420.0/1.html,轉載請聲明來源鉆瓜專利網。





