[發明專利]醫療文本的檢索方法、電子設備及存儲介質在審
| 申請號: | 201810039291.3 | 申請日: | 2018-01-16 |
| 公開(公告)號: | CN108256061A | 公開(公告)日: | 2018-07-06 |
| 發明(設計)人: | 胡琴敏;王月瑤 | 申請(專利權)人: | 華東師范大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06K9/62 |
| 代理公司: | 上海隆天律師事務所 31282 | 代理人: | 臧云霄;潘一諾 |
| 地址: | 200333 上*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 查詢項 文本 存儲介質 電子設備 醫療 檢索 分類結果 優化 貝葉斯模型 偽相關反饋 文本數據庫 查詢擴展 文本檢索 保留 分類 | ||
本發明提供一種醫療文本的檢索方法、電子設備及存儲介質,一種醫療文本的檢索方法,包括如下步驟:S110:獲取包含病癥描述的文本,將所述文本作為初始查詢項;S120:利用樸素貝葉斯模型對初始查詢項進行分類,分類結果包括查詢項縮減和查詢項擴展;S130:保留分類結果為查詢項擴展的初始查詢項,并作為中間查詢項;S140:利用偽相關反饋對所述中間查詢項進行查詢擴展,將擴展后的中間查詢項作為優化查詢項;S150:利用所述優化查詢項在醫療文本數據庫中進行文本檢索。本發明提供的方法、電子設備及存儲介質能夠優化醫療文本的查詢項。
技術領域
本發明涉及計算機信息處理技術領域,尤其涉及一種醫療文本的檢索方法、電子設備及存儲介質。
背景技術
對于醫療文本檢索中,輸入的醫療數據也就是查詢項的質量,很大程度影響著查詢結果的好壞。而查詢結果是為了輔助醫生做出更好的診斷,不相關的結果并沒有任何意義。
對于傳統的查詢處理方法來說,更多的關注查詢項的擴展,而對于原有噪聲數據的擴展反倒會進一步降低查詢的相關度。在這個過程中,查詢縮減這個步驟不可或缺。因此,需要提出一種新型的基于醫療文本的查詢優化方法,不僅僅關注于查詢擴展,而是在縮減的基礎上再進行擴展,對查詢項做出更好的處理,從而得到更相關的查詢結果。
發明內容
本發明為了克服上述現有技術存在的缺陷,提供一種醫療文本的檢索方法、電子設備及存儲介質,以優化醫療文本的查詢項。
根據本發明的一個方面,提供一種醫療文本的檢索方法,包括如下步驟:
S110:獲取包含病癥描述的文本,將所述文本作為初始查詢項;
S120:利用樸素貝葉斯模型對初始查詢項進行分類,分類結果包括查詢項縮減和查詢項擴展;
S130:保留分類結果為查詢項擴展的初始查詢項,并作為中間查詢項;
S140:利用偽相關反饋對所述中間查詢項進行查詢擴展,將擴展后的中間查詢項作為優化查詢項;
S150:利用所述優化查詢項在醫療文本數據庫中進行文本檢索。
可選地,所述步驟S120包括:
S121:對所述初始查詢項進行向量化獲得所述初始查詢項的詞向量;
S122:將初始查詢項的詞向量作為所述樸素貝葉斯模型的輸入。
可選地,所述步驟S121基于共現矩陣的詞向量模型對所述初始查詢項進行向量化獲得所述初始查詢項的詞向量。
可選地,所述樸素貝葉斯模型采用如下步驟進行訓練:
將基于醫療文本的情感詞典作為所述樸素貝葉斯模型的語料庫;
獲取語料庫中的語料及語料標注;
對所述語料庫中的語料進行向量化獲得所述語料庫中的語料的詞向量;
將所述詞向量作為所述樸素貝葉斯模型的輸入;
根據將所述語料庫中的語料對應的語料標注確定分類結果,并將所述分類結果作為所述樸素貝葉斯模型的輸出;
訓練所述樸素貝葉斯模型。
可選地,基于共現矩陣的詞向量模型對所述語料庫中的語料進行向量化獲得所述語料庫中的語料的詞向量。
可選地,所述語料標注包括正面詞和否定詞,若所述語料標注為正面詞,則所述分類結果為查詢項擴展;若所述語料標注為否定詞,則所述分類結果為查詢項縮減。
可選地,所述S140包括:
將所述中間查詢項與一擴展詞庫中的候選詞進行相似度匹配;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華東師范大學,未經華東師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810039291.3/2.html,轉載請聲明來源鉆瓜專利網。





