[發(fā)明專利]一種基于知識圖譜的中文醫(yī)藥問答系統(tǒng)及方法在審
| 申請?zhí)枺?/td> | 202110763704.4 | 申請日: | 2021-07-06 |
| 公開(公告)號: | CN113569023A | 公開(公告)日: | 2021-10-29 |
| 發(fā)明(設(shè)計)人: | 龍海霞;劉博韜;徐新黎;馬驥;周艷波;肖杰 | 申請(專利權(quán))人: | 浙江工業(yè)大學(xué) |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/33;G06F40/295;G06F40/30;G06F16/36;G06F16/35;G06K9/62;G06F16/951 |
| 代理公司: | 杭州斯可睿專利事務(wù)所有限公司 33241 | 代理人: | 王利強(qiáng) |
| 地址: | 310014 浙江省*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 知識 圖譜 中文 醫(yī)藥 問答 系統(tǒng) 方法 | ||
一種基于知識圖譜的中文醫(yī)藥問答系統(tǒng),包括知識圖譜構(gòu)建模塊、問題分類模塊、數(shù)據(jù)庫查詢模塊、答案整合模塊和結(jié)果展示模塊。一種基于知識圖譜的中文醫(yī)藥問答方法,包括以下步驟:S1.獲取用戶的查詢文本;S2.對用戶的問句進(jìn)行解析,獲取主語實體、問題類別和問題類型;S3.根據(jù)解析結(jié)果以及預(yù)先構(gòu)建的中文醫(yī)藥知識圖譜進(jìn)行相關(guān)查詢,獲取查詢結(jié)果;S4.對醫(yī)藥查詢結(jié)果進(jìn)行整理,形成符合自然語言的對話答案以及可視化數(shù)據(jù);S5.對文本答案以及可視化數(shù)據(jù)進(jìn)行展示。本發(fā)明提高了問題類型劃分的準(zhǔn)確率以及答案精度,滿足了用戶醫(yī)藥咨詢、食品指南、疾病輔助診療的需求,為用戶提供了更加便捷高效的服務(wù)。
技術(shù)領(lǐng)域
本發(fā)明涉及知識圖譜與機(jī)器學(xué)習(xí)領(lǐng)域,更具體的說是涉及一種基于知識圖譜的中文醫(yī)藥問答系統(tǒng)及其方法。
背景技術(shù)
隨著人們對互聯(lián)網(wǎng)的應(yīng)用越來越多,醫(yī)療大數(shù)據(jù)已經(jīng)一步一步走進(jìn)人們?nèi)粘I町?dāng)中。如何對體積龐大、結(jié)構(gòu)復(fù)雜的數(shù)據(jù)進(jìn)行分析,從中獲取可利用的醫(yī)學(xué)知識,是醫(yī)療大數(shù)據(jù)實際應(yīng)用的關(guān)鍵。醫(yī)藥問答系統(tǒng)是醫(yī)學(xué)領(lǐng)域中理解用戶意圖,幫助用戶獲取答案的一種典型應(yīng)用。知識圖譜以圖結(jié)構(gòu)形式對數(shù)據(jù)進(jìn)行存儲和處理,可以從海量的數(shù)據(jù)中抽取出有用的信息,有效處理海量醫(yī)療數(shù)據(jù)。目前網(wǎng)頁查詢很難對用戶提出的醫(yī)藥類問題給出針對性強(qiáng)的回答,而醫(yī)藥問答系統(tǒng)可以解決此類問題。
好的問題解析算法是問答系統(tǒng)質(zhì)量的關(guān)鍵,常用的問題解析方法包含模板匹配和語義解析。其中模板匹配通過匹配問句的關(guān)鍵詞,將問題匹配上對應(yīng)的問題模板,然后進(jìn)行答案的查詢。語義解析基于轉(zhuǎn)換器的雙向編碼表征模型(Bidirectional EncoderRepresentations from Transformers,BERT)進(jìn)行開發(fā),BERT模型可以對同一詞語在不同上下文環(huán)境中生成相應(yīng)的動態(tài)詞向量,有著強(qiáng)大的語義理解能力。語義解析利用BERT文本相似度進(jìn)行問題分析,然后轉(zhuǎn)為數(shù)據(jù)庫查詢語句,進(jìn)行答案搜索。結(jié)合這兩種方法,提供一種基于知識圖譜的中文醫(yī)藥問答系統(tǒng)及其方法。
發(fā)明內(nèi)容
為了解決現(xiàn)有中文醫(yī)藥領(lǐng)域問題搜索匹配不準(zhǔn)確,答案返回不精確,個性化搜索能力不足等問題,考慮到中文醫(yī)藥知識圖譜的知識連接和語義分析能力,本發(fā)明提供了一種基于知識圖譜的醫(yī)藥問答系統(tǒng)及其方法,可以更快速、高效地查找醫(yī)藥領(lǐng)域相關(guān)問題答案。
本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是:
一種基于知識圖譜的中文醫(yī)藥問答系統(tǒng)及方法,包括知識圖譜構(gòu)建模塊、問題分類模塊、數(shù)據(jù)庫查詢模塊、答案整合模塊和結(jié)果展示模塊;
所述知識圖譜構(gòu)建模塊,用于根據(jù)醫(yī)藥百科網(wǎng)站獲取的數(shù)據(jù)構(gòu)建中文醫(yī)藥知識圖譜;
所述問題分類模塊,用于實現(xiàn)識別用戶問句的主語實體、問題類別和問題類型。其中問題類別為事實類和是否類,事實類為詢問具體的實體,例如“感冒的該吃什么藥”,此種問題給出對應(yīng)的事實答案;是否類為詢問兩種實體間關(guān)系,例如“感冒可以吃雞蛋嗎”,此種問題依據(jù)知識圖譜給出肯定或否定的答案。問題類型包含多個種類,例如疾病詢問用藥、疾病詢問治愈時間、疾病詢問癥狀等;
所述數(shù)據(jù)庫查詢模塊,用于根據(jù)問題分類的結(jié)果,將其轉(zhuǎn)換為對應(yīng)的數(shù)據(jù)庫查詢語句;
所述答案整合模塊,用于將數(shù)據(jù)庫查詢語句送入數(shù)據(jù)庫,對返回的結(jié)果進(jìn)行整理,將查詢的內(nèi)容組裝為符合自然語言的答案以及對應(yīng)的可視化數(shù)據(jù)結(jié)構(gòu);
所述結(jié)果展示模塊,用于顯示前端聊天室,并對查詢結(jié)果進(jìn)行文本以及可視化圖譜展示。
優(yōu)選的,所述知識圖譜構(gòu)建模塊包括醫(yī)藥數(shù)據(jù)爬取單元、結(jié)構(gòu)調(diào)整單元和醫(yī)藥數(shù)據(jù)存儲單元;
所述醫(yī)藥數(shù)據(jù)爬取單元,用于對網(wǎng)頁端醫(yī)療百科網(wǎng)站的文本數(shù)據(jù)進(jìn)行爬取,并傳遞至結(jié)構(gòu)調(diào)整單元;
所述結(jié)構(gòu)調(diào)整單元,用于對醫(yī)藥數(shù)據(jù)爬取單元所獲得文本數(shù)據(jù)進(jìn)行整理,將其按照數(shù)據(jù)庫要求的格式進(jìn)行轉(zhuǎn)換,拆分為節(jié)點對應(yīng)節(jié)點屬性和節(jié)點對應(yīng)節(jié)點兩種類型存入數(shù)據(jù)庫用于后續(xù)分析;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江工業(yè)大學(xué),未經(jīng)浙江工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110763704.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 用于圖譜界面的數(shù)據(jù)處理方法及系統(tǒng)
- 用于內(nèi)容特征圖譜化的特征圖譜布局的服務(wù)器及介質(zhì)
- 圖譜的構(gòu)建方法及裝置、電子設(shè)備
- 信息圖譜構(gòu)建方法、裝置及設(shè)備
- 知識圖譜的完善方法及裝置、數(shù)據(jù)處理方法及裝置
- 一種知識圖譜的構(gòu)建方法、裝置、知識圖譜系統(tǒng)及設(shè)備
- 一種基于知識圖譜的故障判別推理方法
- 一種事件圖譜的匹配方法、裝置、電子設(shè)備及存儲介質(zhì)
- 一種用于創(chuàng)建知識圖譜的計算機(jī)設(shè)備
- 一種支持增量實體關(guān)聯(lián)的關(guān)系圖譜計算方法





