[發明專利]醫療自動問答方法及裝置、存儲介質、電子設備有效
| 申請號: | 201810939302.3 | 申請日: | 2018-08-17 |
| 公開(公告)號: | CN108932349B | 公開(公告)日: | 2019-03-26 |
| 發明(設計)人: | 鹿文鵬;張玉騰;張若雨;張旭;岳書通;成金勇 | 申請(專利權)人: | 齊魯工業大學 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G16H80/00;G06N3/04 |
| 代理公司: | 濟南信達專利事務所有限公司 37100 | 代理人: | 孫園園 |
| 地址: | 250353 山東省濟南*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 模型訓練 自動問答 醫療 構建 自然語言處理技術 存儲介質 答案選擇 電子設備 數據集 知識庫 模型構建單元 人工智能領域 自動問答裝置 知識庫構建 生成單元 問題解答 匹配 工作量 答案 計算機 醫生 | ||
本發明公開了醫療自動問答方法及裝置、存儲介質、電子設備,屬于自然語言處理技術領域及計算機人工智能領域,本發明要解決的技術問題為如何使用自然語言處理技術為患者在已有的問答結果中選擇匹配的答案并將其推薦給用戶,減少醫生的工作量,提高問題解答的速度,采用的技術方案為:①一種醫療自動問答方法,該方法包括如下步驟:S1、構建醫療問答知識庫;S2、構建問答模型訓練數據集;S3、構建問答模型;S4、訓練問答模型和答案選擇。②一種醫療自動問答裝置,該裝置包括:醫療問答知識庫構建單元、問答模型訓練數據集生成單元、問答模型構建單元以及問答模型訓練和答案選擇單元。
技術領域
本發明涉及自然語言處理技術領域及計算機人工智能領域,具體地說是醫療自動問答方法及裝置、存儲介質、電子設備。
背景技術
隨著當前互聯網的快速發展,傳統的醫療行業開始擁抱互聯網,涌現了一大批方便患者的問答的網址,其中的在線醫療問答社區發展較為迅速,因為它極大地減少了患者向醫生求助的環節,患者在互聯網社區發布問題,由相關專業的醫生解疑答惑,避免了傳統就醫環節中,前往醫院、掛號、排隊的流程。然而,隨著在線提問的用戶數量的增加,問題的增加速度遠遠大于解答的速度,主要包括兩方面的原因:一方面是患者的數量遠遠高于專業醫生的數量,并且在社區中解答問題的醫生數量更少;另一方面是由于患者缺乏專業的醫學知識,無法專業地描述問題,因此會對同樣的問題提出不同的描述,這就造成了問答社區中存在著大量的重復問題。醫生數量稀少的問題暫無解決辦法,但是可以從問題重復現象出發進行處理,如何使用自然語言處理技術為患者在已有的問答結果中選擇匹配的答案并將其推薦給用戶,減少醫生的工作量,提高問題解答的速度是目前現有技術中急需解決的技術問題。
專利號為CN107516110A的專利文獻公開了一種基于集成卷積編碼的醫療問答語義聚類方法,所述方法包括以下步驟:步驟1:從醫療平臺上獲取醫療問答數據,對醫療問答數據集進行預處理,并得到輸入矩陣;步驟2:用卷積編碼網絡對不同的輸入矩陣選取不同的卷積核進行核聚類,對核聚類后的聚類質量和多樣性進行計算,根據聚類質量和多樣性挑選出表示文本特征最好的n個卷積核;步驟3:將步驟2中挑選的卷積核分別通過卷積神經網絡來進行訓練操作;步驟4:融合不同卷積核的特征表示結果;步驟5:將融合后的特征表示結果輸入自編碼機,進行輸入重構訓練得到最佳特征表示;步驟6:將編碼得到的最佳特征表示進行聚類,得到最終醫療文本語義聚類結果。但是該技術方案僅是對醫療文本的分類,無法精準獲取醫療問題的精準答案。
發明內容
本發明的技術任務是提供一種醫療自動問答方法及裝置、存儲介質、電子設備,來解決如何使用自然語言處理技術為患者在已有的問答結果中選擇匹配的答案并將其推薦給用戶,減少醫生的工作量,提高問題解答的速度的問題。
本發明的技術任務是按以下方式實現的,一種醫療自動問答方法,該方法包括如下步驟:
S1、構建醫療問答知識庫:從互聯網的醫療問答社區爬取問答對,并對問答對進行預處理構建成醫療問答知識庫;
S2、構建問答模型訓練數據集;對于每個醫療問題,在步驟S1中的醫療問答知識庫中至少有一個正確答案,將正確答案與問題構建訓練正例,將除正確答案以外的答案與問題構建訓練負例;其中,負例的數量根據醫療問答知識庫的大小設定;
S3、構建問答模型:利用卷積神經網絡構建問答模型;
S4、訓練問答模型和答案選擇:在步驟S2所得到問答模型訓練數據集中對步驟S3構建的問題模型進行訓練。
作為優選,所述步驟S1中構建醫療問答知識庫的具體步驟如下:
S101、利用爬蟲技術,從互聯網的醫療問答社區爬取問答對:在互聯網上有著大量的醫療問答社區,其內容是開放可獲取的;醫療問答社區均采用Web形式進行展示,利用Scrapy工具獲取問題和所對應的答案,構建問答知識庫;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于齊魯工業大學,未經齊魯工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810939302.3/2.html,轉載請聲明來源鉆瓜專利網。





