[發(fā)明專利]一種基于知識圖譜的電子病歷問答方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 202010047420.0 | 申請日: | 2020-01-16 |
| 公開(公告)號: | CN111274373A | 公開(公告)日: | 2020-06-12 |
| 發(fā)明(設(shè)計)人: | 崔立真;柏欣雨;何偉;鹿旭東;郭偉 | 申請(專利權(quán))人: | 山東大學 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/36;G16H10/60 |
| 代理公司: | 濟南圣達知識產(chǎn)權(quán)代理有限公司 37221 | 代理人: | 李琳 |
| 地址: | 250100 山*** | 國省代碼: | 山東;37 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 知識 圖譜 電子 病歷 問答 方法 系統(tǒng) | ||
本公開公開了一種基于知識圖譜的電子病歷問答方法及系統(tǒng),包括構(gòu)建基于電子病歷數(shù)據(jù)的知識圖譜,根據(jù)歷史問題查詢信息,統(tǒng)計關(guān)鍵詞的種類和數(shù)量,構(gòu)建提問語句模板;對獲取的問句進行基于字的標注和字的嵌入,以問句中每個字的字嵌入向量構(gòu)成句子表示矩陣,對句子表示矩陣使用雙向長短期記憶模型和條件隨機場進行序列標注,輸出詞標注結(jié)果和其對應(yīng)的標簽;將詞標注結(jié)果和其對應(yīng)的標簽與提問語句模板進行匹配,得到SPARQL語句生成模板,將標注的詞語和其對應(yīng)的標簽填入SPARQL語句生成模板中,生成SPARQL查詢語句;將SPARQL查詢語句輸入知識圖譜中進行查詢,得到答案。可以更好地描述患者和醫(yī)療事件之間的關(guān)系,可以快速準確地幫助用戶查詢出所需的電子病歷信息。
技術(shù)領(lǐng)域
本公開涉及知識圖譜和醫(yī)學自然語言處理技術(shù)領(lǐng)域,特別是涉及一種基于知識圖譜的電子病歷問答方法及系統(tǒng)。
背景技術(shù)
本部分的陳述僅僅是提供了與本公開相關(guān)的背景技術(shù)信息,不必然構(gòu)成在先技術(shù)。
在社會高速發(fā)展的今天,數(shù)據(jù)量的飛速增長使信息越來越多,人們對信息的精準度要求也越來越高。傳統(tǒng)的信息檢索方法基于關(guān)鍵詞檢索經(jīng)常不能理解用戶真正想要表達的內(nèi)容,返回的排序后的相關(guān)文檔,仍需用戶手動從中檢索出答案。區(qū)別于傳統(tǒng)的關(guān)鍵詞檢索,問答系統(tǒng)的輸入是自然語言問題,返回的是簡潔而準確的答案。問答系統(tǒng)具有解讀用戶的檢索語句的能力,可以快速準確地幫助用戶獲取目標信息。在此背景下,針對不同領(lǐng)域的問答系統(tǒng)和語義搜索成為了研究熱點。
醫(yī)療電子病歷是記錄病人信息的主要媒介,對電子病歷的查詢和分析,在醫(yī)療衛(wèi)生管理和臨床科研中有著廣泛的用途。傳統(tǒng)的關(guān)鍵詞檢索難以從海量的文本數(shù)據(jù)中找到醫(yī)學工作者真正關(guān)注的電子病歷信息,對于不熟悉SPARQL等形式化查詢語言的醫(yī)學工作者來說,從電子病歷信息中搜索自己感興趣的信息成為了一項幾乎無法完成的任務(wù)。
發(fā)明內(nèi)容
為了解決上述問題,本公開提出了一種基于知識圖譜的電子病歷問答方法及系統(tǒng),針對結(jié)構(gòu)化電子病歷特點構(gòu)建了知識圖譜,并依照構(gòu)建的知識圖譜中的RDF關(guān)系對問題進行解析,依據(jù)從問題中解析的實體和構(gòu)建屬于該問題的SPARQL語句,從知識圖譜中查詢答案。
為了實現(xiàn)上述目的,本公開采用如下技術(shù)方案:
第一方面,本公開提供一種基于知識圖譜的電子病歷問答方法,包括:
構(gòu)建基于電子病歷數(shù)據(jù)的知識圖譜,根據(jù)歷史問題查詢信息,統(tǒng)計關(guān)鍵詞的種類和數(shù)量,構(gòu)建提問語句模板;
對獲取的問句進行基于字的標注和字的嵌入,以問句中每個字的字嵌入向量構(gòu)成句子表示矩陣,對句子表示矩陣使用雙向長短期記憶模型和條件隨機場進行序列標注,輸出詞標注結(jié)果和其對應(yīng)的標簽;
將詞標注結(jié)果和其對應(yīng)的標簽與提問語句模板進行匹配,得到SPARQL語句生成模板,將標注的詞語和其對應(yīng)的標簽填入SPARQL語句生成模板中,生成SPARQL查詢語句;
將SPARQL查詢語句輸入知識圖譜中進行查詢,得到答案。
作為可能的一些實現(xiàn)方式,將電子病歷構(gòu)建成基于資源描述框架的數(shù)據(jù)表示模型的知識圖譜,以患者、疾病、藥物、化驗、就診、治療和檢查字段作為知識圖譜的主體,以描述事件主客體關(guān)系和時序關(guān)系作為知識圖譜的屬性,以知識圖譜中主體和屬性關(guān)系作為基本的模式描述數(shù)據(jù)之間的關(guān)系。
作為可能的一些實現(xiàn)方式,所述構(gòu)建提問語句模版,通過分析歷史問題的內(nèi)容對其進行關(guān)鍵詞標注,統(tǒng)計關(guān)鍵詞的種類和數(shù)量,構(gòu)建提問語句模版;
根據(jù)知識圖譜中主體和屬性關(guān)系,對獲取的問句采用BIO標注法進行基于字的標注。
作為可能的一些實現(xiàn)方式,對獲取的問句進行字的嵌入過程包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于山東大學,未經(jīng)山東大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010047420.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 用于圖譜界面的數(shù)據(jù)處理方法及系統(tǒng)
- 用于內(nèi)容特征圖譜化的特征圖譜布局的服務(wù)器及介質(zhì)
- 圖譜的構(gòu)建方法及裝置、電子設(shè)備
- 信息圖譜構(gòu)建方法、裝置及設(shè)備
- 知識圖譜的完善方法及裝置、數(shù)據(jù)處理方法及裝置
- 一種知識圖譜的構(gòu)建方法、裝置、知識圖譜系統(tǒng)及設(shè)備
- 一種基于知識圖譜的故障判別推理方法
- 一種事件圖譜的匹配方法、裝置、電子設(shè)備及存儲介質(zhì)
- 一種用于創(chuàng)建知識圖譜的計算機設(shè)備
- 一種支持增量實體關(guān)聯(lián)的關(guān)系圖譜計算方法





