[發明專利]一種面向醫療領域的基于多源異構數據問答系統及該系統的實現方法在審
| 申請號: | 201711448417.4 | 申請日: | 2017-12-27 |
| 公開(公告)號: | CN108108449A | 公開(公告)日: | 2018-06-01 |
| 發明(設計)人: | 趙鐵軍;關毅;李岳;朱聰慧 | 申請(專利權)人: | 哈爾濱福滿科技有限責任公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G16H70/00 |
| 代理公司: | 哈爾濱市陽光惠遠知識產權代理有限公司 23211 | 代理人: | 梁超 |
| 地址: | 150001 黑龍江省哈爾濱*** | 國省代碼: | 黑龍江;23 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 問答系統 醫療健康 多源異構數據 醫療領域 客戶端 服務器 答案 結構化數據庫 數據來源 數據問答 語義信息 算法 圖譜 合成 返回 開放 | ||
1.一種面向醫療領域的基于多源異構數據問答系統,其特征在于,該問答系統包括客戶端和服務器,客戶端向服務器發起獲取答案的請求,服務器從結構化數據庫、醫療健康問答對數據和開放知識圖譜中獲取答案,并將答案進行處理和合成后返回至客戶端。
2.基于權利要求1所述一種面向醫療領域的基于多源異構數據問答系統的實現方法,其特征在于,該問答系統的實現方法的具體過程為:
步驟1、收集中文語料庫;
收集醫療健康問答對數據;
收集具有結構化特征的醫療健康文本數據,并將醫療健康文本數據轉化成結構化數據庫;
步驟2、將步驟1收集的中文語料庫中的語料數據進行詞向量訓練,并保存模型,作為深度學習模型的預訓練詞向量;
步驟3、利用步驟2的預訓練詞向量對步驟1收集的醫療健康問答對數據進行帶注意力機制的序列到序列網絡的訓練,訓練生成的模型用于獲得醫療健康問答對中的答案;
步驟4、利用步驟1生成的結構化數據庫獲取結構化數據庫中對應的答案:
獲取結構化數據庫中對應答案的具體過程為:
步驟4-1、通過步驟1生成的結構化數據庫構建病名詞典、癥狀詞典和用戶意圖特征詞典;
步驟4-2、基于病名詞典、癥狀詞典和用戶意圖特征詞典對用戶問句進行槽填充,槽填充后的用戶問句為已標記的詞典用戶問句;
步驟4-3、將已標記的詞典用戶問句轉換生成SQL查詢語句;
步驟4-4、使用生成的SQL查詢語句從結構化數據庫中查詢答案;從結構化數據庫中獲取的答案如果過長,對答案進行自動摘要;
步驟5、收集步驟4中的已標記用戶問句作為訓練數據;基于帶條件隨機場算法解碼的雙向長短期記憶單元網絡模型,對已標記的用戶問句進行訓練;使用訓練好的帶條件隨機場算法解碼的雙向長短期記憶單元網絡模型,對用戶問句再次進行槽填充,獲得已標記的雙向長短期記憶單元網絡模型用戶問句;
將已標記的雙向長短期記憶單元網絡模型用戶問句轉換成開放知識圖譜查詢API;
發起API請求獲取相應開放知識圖譜答案;
將從開放知識圖譜中獲取的答案根據已標記的雙向長短期記憶單元網絡模型用戶問句和相應模版轉換成自然語言形式的答案;
步驟6、對步驟3中獲取的醫療健康問答對中的答案、步驟4中獲取的結構化數據庫中的答案和步驟5中獲取的開放知識圖譜中的答案進行合并;
對所有的答案進行合并的具體過程為:將所有的答案按照句子級別劃分,從語法和語義兩個層面計算句子之間的相似度,當有相似的句子時,隨機除去一個,最后將所有的答案合并為一個答案;
步驟7、根據用戶問句,采用步驟6的計算句子之間相似度的方法,從歷史問答對中查找與當前用戶問句相似的問句,進行相似問句的推薦。
3.根據權利要求2所述的一種面向醫療領域的基于多源異構數據問答系統的實現方法,其特征在于,步驟3所述對數據進行帶注意力機制的序列到序列網絡的訓練的具體過程為:
步驟3-1、采用步驟2的預訓練詞向量對醫療健康問答對數據中的所有詞進行初始化;
步驟3-2、采用記憶網絡模型對用戶問句進行編碼,獲得編碼后的輸出值和隱狀態;
步驟3-3、采用記憶網絡模型,結合注意力機制,對編碼后的輸出值、隱狀態和用戶問句的輸入值進行解碼,獲得預測后的答案;
步驟3-4、根據解碼后的答案和真實答案計算損失函數;
步驟3-5、判斷損失參數是否收斂,如果否,則執行步驟3-6,如果是,則執行步驟3-7;
步驟3-6、根據損失函數進行反向傳播,更新參數,然后返回執行步驟3-2;
步驟3-7、帶注意力機制的序列到序列網絡的訓練完成。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈爾濱福滿科技有限責任公司,未經哈爾濱福滿科技有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711448417.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種生成全國道路畫像的方法及系統
- 下一篇:圖像處理的方法及相關設備





