[發明專利]一種面向醫療領域的基于多源異構數據問答系統及該系統的實現方法在審
| 申請號: | 201711448417.4 | 申請日: | 2017-12-27 |
| 公開(公告)號: | CN108108449A | 公開(公告)日: | 2018-06-01 |
| 發明(設計)人: | 趙鐵軍;關毅;李岳;朱聰慧 | 申請(專利權)人: | 哈爾濱福滿科技有限責任公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G16H70/00 |
| 代理公司: | 哈爾濱市陽光惠遠知識產權代理有限公司 23211 | 代理人: | 梁超 |
| 地址: | 150001 黑龍江省哈爾濱*** | 國省代碼: | 黑龍江;23 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 問答系統 醫療健康 多源異構數據 醫療領域 客戶端 服務器 答案 結構化數據庫 數據來源 數據問答 語義信息 算法 圖譜 合成 返回 開放 | ||
一種面向醫療領域的基于多源異構數據問答系統及該系統的實現方法,屬于醫療健康領域,本發明為解決現有醫療健康問答系統中數據來源單一、算法單一、考慮的語義信息少的問題。本發明所述一種面向醫療領域的基于多源異構數據問答系統,包括客戶端和服務器,客戶端向服務器發起獲取答案的請求,服務器從結構化數據庫、醫療健康問答對數據和開放知識圖譜中獲取答案,并將答案進行處理和合成后返回至客戶端。本發明用于醫療健康領域的數據問答系統。
技術領域
本發明涉及一種基于多源異構數據問答系統及該系統的實現方法,屬于醫療健康領域。
背景技術
隨著互聯網的發展,互聯網累積了海量的醫療健康信息資源,并且多以文本問答對、文本數據等方式呈現。然而傳統的搜索引擎網頁搜索結果較多,而且可能有許多重復和無關的內容。尤其對于醫療健康的相關問題,用戶使用搜索引擎難以區分可靠和不可靠的答案。因此,醫療健康領域急需一個專業可靠的知識獲取系統,以盡可能充分利用網絡健康信息資源。
問答系統作為自然語言處理的重要分支,對提高人們獲取知識的效率、改善人機交互體驗具有重大作用。相對于傳統的信息檢索系統,自動問答系統返回用戶的不再是基于關鍵詞匹配排序的文檔列表,而是精準的自然語言答案。近年來,隨著人工智能的飛速發展,自動問答已經成為倍受關注且發展前景廣泛的研究方向。與此同時,海量的在線健康問答數據和自然語言處理技術的發展,這些都給醫療健康自動問答系統提供了有利的環境。
從用戶的角度,醫療健康自動問答系統可以緩解醫患之間信息不對稱的矛盾,極大地降低用戶的使用門檻,方便大家的生活。用戶可以隨時使用醫療健康自動問答系統,方便快捷地咨詢醫療健康相關問題,如疾病的癥狀、并發癥、治療方法等,隨時解決日常中基本的健康問題。從研究的角度,自動問答作為自然語言處理領域的熱門研究方向,在國外醫學領域的應用已有了初步發展,但在國內尚未引起充分重視。同時,網絡健康信息資源往往以文本問答對、文本數據等多種方式呈現。
近年來,隨著深度學習算法的不斷發展,越來越多的深度學習算法應用于自然語言處理,例如使用詞向量對詞進行表示、基于雙向LSTM(Long Short-Term Memory,長短期記憶網絡)結合CRF算法(Conditional Random Field Algorithm,條件隨機場算法)的命名實體識別、端到端的語言生成模型等。
詞向量是近年來常用來替代傳統詞袋的詞表示方法,解決了詞袋表示帶來的維數災難問題。研究人員還發現,通過訓練語言模型得到的詞向量蘊含了詞匯的語義信息,還可以通過一些算法能夠在一定程度上得到詞匯的相似度等數據,可以用于計算問句的相似度。
命名實體識別作為信息抽取的基本任務之一,在問答系統、句法分析、機器翻譯等領域中都有重要應用。命名實體識別任務使用的模型主要有以CRF為代表的傳統模型和深度神經網絡模型兩類,而在醫療領域一般還在使用傳統的CRF模型。研究表明,使用雙向LSTM結合CRF的方法能夠有效提高命名實體識別的精度。
序列到序列的語言生成模型可以有效用于基于問答對的問答系統。序列到序列的記憶神經網絡模型并應用于自動問答的優點是把傳統的問句解析、文本檢索、答案抽取與生成等復雜步驟轉變成了一個可學習的過程。
現有的面向醫療健康領域的自動問答系統多是基于文檔檢索的方法,這些方法很難考慮語義的信息;雖然也存在一些基于知識庫的問答系統,但是面向醫療健康領域的較少,而中文領域的醫療健康問答系統更是非常少見,并且這些系統的數據源往往是單一的。
發明內容
本發明是為了解決現有醫療健康問答系統中數據來源單一、算法單一、考慮的語義信息少的問題,提出的一種面向醫療領域的基于多源異構數據問答系統及該系統的實現方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈爾濱福滿科技有限責任公司,未經哈爾濱福滿科技有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711448417.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種生成全國道路畫像的方法及系統
- 下一篇:圖像處理的方法及相關設備





