[發明專利]一種基于醫療知識圖譜的智能疾病預測系統在審
| 申請號: | 202011120010.0 | 申請日: | 2020-10-19 |
| 公開(公告)號: | CN112151188A | 公開(公告)日: | 2020-12-29 |
| 發明(設計)人: | 楊紫勝 | 申請(專利權)人: | 科技谷(廈門)信息技術有限公司 |
| 主分類號: | G16H50/70 | 分類號: | G16H50/70;G06F16/33;G06F40/295;G06N3/04 |
| 代理公司: | 廈門致群財富專利代理事務所(普通合伙) 35224 | 代理人: | 劉兆慶;鄧貴琴 |
| 地址: | 361000 福建省廈*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 醫療 知識 圖譜 智能 疾病 預測 系統 | ||
1.一種基于醫療知識圖譜的智能疾病預測系統,其特征在于:包括實體抽取層、實體連接層和醫療知識圖譜,所述實體抽取層用于對患者主訴及患者特征進行實體識別和關系抽取,所述醫療知識圖譜由醫學概念、醫學關系和醫學證據組成,所述實體連接層根據所述實體抽取層的輸出結果從所述醫療知識圖譜中索引、分析、評分以得到最終預測列表。
2.如權利要求1所述的一種基于醫療知識圖譜的智能疾病預測系統,其特征在于:所述實體抽取層由數據輸入模塊、神經網絡模塊組成,所述數據輸入模塊采用人工手動輸入或語音輸入患者特征及患者主訴從而生成文本,所述神經網絡模塊由Bi-LSTM網絡和CRF網絡組成,所述實體抽取層的輸出結果由疾病種類、疾病癥狀和誘因組成。
3.如權利要求2所述的一種基于醫療知識圖譜的智能疾病預測系統,其特征在于:所述實體識別和關系抽取的過程具體如下:
A1、對所述患者特征及患者主訴生成的文本進行詞嵌入,生成詞向量;
A2、利用Bi-LSTM網絡和CRF網絡聯合模型對所述詞向量進行命名實體識別、分詞和詞性標注,輸出對應的實體識別結果,所述實體識別結果為名詞性主語和非名詞性詞語,所述名詞性主語即包括疾病種類和疾病癥狀;
A3、對所述實體識別結果進行標簽嵌入、關系抽取,輸出非名詞性詞語的關系抽取結果,即誘因。
4.如權利要求1所述的一種基于醫療知識圖譜的智能疾病預測系統,其特征在于:所述醫療知識圖譜的構建具體如下:
B1、搭建圖譜框架,所述圖譜框架包括疾病知識庫、檢查檢驗知識庫、癥狀知識庫、藥品知識庫、身體部位知識庫和手術知識庫;
B2、數據采集,利用爬蟲技術從數據庫爬取醫療知識數據,所述數據庫包括MongoDB、Cassandra、HBase、BerkeleyDB或ElasticSearch;
B3、利用自然語言處理平臺和機器學習平臺對所述醫療知識數據進行分類和學習,結合所述圖譜框架,形成包含節點權重和相關性概率的醫療知識圖譜。
5.如權利要求2所述的一種基于醫療知識圖譜的智能疾病預測系統,其特征在于:所述實體連接層由分析模塊、索引模塊和評分模塊組成,所述分析模塊對所述實體抽取層的輸出結果進行語法分析和語義分析;所述索引模塊根據所述分析模塊的結果從所述醫療知識圖譜索引查詢,輸出備選實體;所述評分模塊利用多維度評分器對所述備選實體進行評分排序,輸出最終預測列表。
6.如權利要求5所述的一種基于醫療知識圖譜的智能疾病預測系統,其特征在于:所述多維度評分器的評分維度包括字符串邊界距離、拼音邊界距離、Wordvec相似度以及同義詞林相似度。
7.如權利要求5所述的一種基于醫療知識圖譜的智能疾病預測系統,其特征在于:所述最終預測列表包括疑似疾病種類、推薦科室以及推薦檢查項目。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于科技谷(廈門)信息技術有限公司,未經科技谷(廈門)信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011120010.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種排污閥
- 下一篇:一種同行人員識別方法、裝置、電子設備及存儲介質





