[發明專利]一種基于知識圖譜的醫療查詢擴展方法有效
| 申請號: | 202110454713.5 | 申請日: | 2021-04-26 |
| 公開(公告)號: | CN113076411B | 公開(公告)日: | 2022-06-03 |
| 發明(設計)人: | 方鈺;崔雪;翟鵬珺 | 申請(專利權)人: | 同濟大學 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/35;G06F40/35;G16H80/00;G06N5/04 |
| 代理公司: | 上海科律專利代理事務所(特殊普通合伙) 31290 | 代理人: | 葉鳳 |
| 地址: | 200092 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 知識 圖譜 醫療 查詢 擴展 方法 | ||
一種基于知識圖譜的醫療查詢擴展方法。自動問答系統中的查詢擴展技術通過向問句中補充擴展信息來減小問答句間的語義差距,從而提高問答系統的準確性。在醫療問答領域,目前的查詢擴展方法沒有充分結合不同查詢意圖下醫學術語間的共現關聯關系與推理關聯關系,因此得到的擴展詞不夠準確。本發明以醫療知識圖譜為擴展詞的知識來源,利用醫學術語在不同查詢意圖下的推理關聯得到候選擴展詞,并結合否定醫學術語識別與互信息技術篩選出最終的擴展詞,最終提高了醫療問答系統的準確率。
技術領域
本發明涉及自然語言處理領域,具體涉及問答系統中查詢的處理。查詢擴展是自動問答系統中的重要環節與關鍵技術。
背景技術
隨著互聯網的快速發展,越來越多患者傾向于通過線上健康社區尋求醫療幫助。然而,急劇增長的問題數量給醫生帶來了巨大的回復負擔。為了緩解醫生的工作負擔以及滿足用戶快速得到答案的需求,大量研究者們投身于醫療問答領域的研究。而在醫療問答系統中,問答句間表達方式的不同造成的詞不匹配以及問答句間信息量不同造成的語義偏差是影響系統準確率的關鍵因素。為此,研究者引入查詢擴展技術,即通過在查詢中補充與查詢相關的擴展詞,來縮小問答句間的偏差,以提升系統的性能。
在當前醫療問答領域,查詢擴展方法主要包括基于關鍵詞的查詢擴展和基于語義的查詢擴展。然而,基于關鍵詞的查詢擴展方式僅從統計層面挑選關鍵詞,忽略了查詢的語義信息,因此可能會擴展很多不相關的醫學實體為原始查詢引入“噪聲”,從而影響答案選擇的質量。基于語義的查詢擴展利用醫學本體庫或醫學語義詞典來挖掘查詢中除表層字面之外的潛在語義,但目前基于語義的查詢擴展研究在獲取候選擴展詞階段是基于醫學實體的概念來挑選候選擴展詞,忽略了問答句間醫學實體的推理關聯關系在指導候選擴展詞獲取中的重要作用。而在擴展詞篩選階段,一部分研究者利用互信息對候選詞進行篩選工作,但他們忽略了否定醫學實體對實體間互信息值的干擾。
發明內容
鑒于現有技術的不足,本發明提出了一種醫療問答中基于實體關聯關系的語義查詢擴展方法。該方法結合查詢意圖與實體間推理關聯關系從醫學知識圖譜中獲取候選擴展詞,并結合否定醫學實體識別和互信息的篩選策略對擴展詞進行篩選工作。
查詢擴展是自動問答系統中重要的一環,它通過對原始問題進行處理來幫助問答模型選出正確答案。目前醫療問答領域的查詢擴展多為利用偽相關反饋獲取擴展詞、利用醫學術語間的統計關系獲取擴展詞、利用術語間的語義相似度獲取擴展詞,得到的擴展詞很可能與查詢意圖無關,不符合查詢所處的醫療場景,或者與查詢本身相關度較小,因此會給問答系統帶來較大噪聲,影響了問答系統的準確率。
針對上述問題,本發明以擴展用戶查詢為目的,采用SVM分類器獲取用戶的查詢意圖,之后基于不同查詢意圖下醫學術語的推理關聯關系從醫療知識圖譜中獲取與查詢相關的候選擴展詞,最后利用否定術語識別技術與互信息技術篩選得到最終擴展詞。
為了實現上述目的,本發明給出的技術方案為:
本發明提供一種基于知識圖譜的醫療查詢擴展方法,包括:
步驟1、對醫療問答對數據集進行預處理;
步驟2、訓練SVM分類器對問句進行查詢意圖預測;
步驟3、結合步驟2得到的查詢意圖從醫療知識圖譜中獲取與查詢相關的候選擴展詞;
步驟4、利用否定醫學術語識別技術與互信息技術篩選步驟3中得到的候選擴展詞,從而得到最終的擴展詞。
有益效果
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于同濟大學,未經同濟大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110454713.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:數據通信方法、裝置以及系統
- 下一篇:一種影像級熱轉印輥涂涂料





