[發明專利]一種基于主要癥狀與伴隨癥狀詞的疾病認知系統有效
| 申請號: | 202010876663.5 | 申請日: | 2020-08-27 |
| 公開(公告)號: | CN111985246B | 公開(公告)日: | 2023-08-15 |
| 發明(設計)人: | 杜樂;杜小軍 | 申請(專利權)人: | 武漢東湖大數據交易中心股份有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F40/289;G06F40/216;G06F18/22;G16H15/00;G16H50/70 |
| 代理公司: | 武漢紅觀專利代理事務所(普通合伙) 42247 | 代理人: | 李季 |
| 地址: | 430000 湖北省武漢市東湖新技術開*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 主要癥狀 伴隨 癥狀 疾病 認知 系統 | ||
1.一種基于主要癥狀與伴隨癥狀詞的疾病認知系統,其特征在于,所述基于主要癥狀與伴隨癥狀詞的疾病認知系統包括:
數據獲取模塊,用于獲取疾病特征信息以及對應癥狀特征信息,根據該疾病特征信息以及對應的癥狀特征信息建立疾病知識數據庫;
數據獲取模塊包括數據集建立模塊,用于獲取疾病特征信息以及對應的癥狀特征信息,所述疾病特征信息包括:疾病特征詞,癥狀特征信息包括:主要癥狀特征詞以及伴隨癥狀特征詞,根據疾病特征信息以及該癥狀特征信息建立不同的特征詞集合,包括:疾病特征詞集合、主要癥狀特征詞集合以及伴隨癥狀特征詞集合;
數據獲取模塊還包括數據庫建立模塊,用于根據疾病特征信息以及對應癥狀特征信息之間的對應關系建立疾病特征信息與對應癥狀特征信息的關系表,將該特征詞集合與關系表組合,作為疾病知識數據庫;
特征提取模塊,用于獲取待識別臨床癥狀特征信息,通過TF-IDF從待識別臨床癥狀特征信息中提取疾病特征分詞以及對應的癥狀特征分詞,根據該疾病特征分詞以及對應的癥狀特征分詞獲取待識別疾病特征詞以及對應的待識別癥狀特征詞,待識別臨床癥狀特征信息包括臨床主癥狀與伴隨癥狀特征信息;
匹配模塊,用于將待識別疾病特征詞與疾病特征信息進行匹配,獲取待識別疾病特征詞與疾病特征信息之間的匹配相似度,根據該匹配相似度從疾病知識數據庫中查找與疾病特征信息對應的癥狀特征信息,得出相應類別疾病;
認知模塊,用于建立Jaccard系數相似性算法,在得出的相應類別疾病的基礎上,通過Jaccard系數相似性算法計算待識別癥狀特征詞中的伴隨癥狀特征信息與癥狀特征信息中的伴隨癥狀特征信息之間的相似性,并生成對應認知報告,得出相應類別疾病。
2.如權利要求1所述的基于主要癥狀與伴隨癥狀詞的疾病認知系統,其特征在于:特征提取模塊包括特征分詞提取模塊,用于獲取待識別臨床癥狀特征信息,所述待識別臨床癥狀特征信息包括:疾病文本描述以及對應的癥狀文本描述,利用TF-IDF從待識別臨床癥狀特征信息中提取各個詞條的出現頻率數據,設定出現頻率閾值,將各個詞條的出現頻率數據與出現頻率閾值進行比較,將出現頻率數據大于出現頻率閾值的詞條作為特征分詞。
3.如權利要求2所述的基于主要癥狀與伴隨癥狀詞的疾病認知系統,其特征在于:特征提取模塊包括特征詞提取模塊,用于設定常用詞庫,根據該常用詞庫對特征分詞進行篩選,將篩選出的常用詞從對應的特征分詞中刪除,保留剩余特征分詞作為待識別疾病特征詞。
4.如權利要求3所述的基于主要癥狀與伴隨癥狀詞的疾病認知系統,其特征在于:匹配模塊包括匹配計算模塊,用于設定匹配相似度閾值,將疾病特征詞集合中的各特征詞與待識別疾病特征詞進行匹配計算,計算出對應的匹配相似度,將該匹配相似度與匹配相似度閾值進行比較,當該匹配相似度大于匹配相似度閾值時,對疾病特征詞集合中的特征詞進行標記,并通過該特征詞從疾病知識數據庫查詢對應的癥狀特征信息。
5.如權利要求4所述的基于主要癥狀與伴隨癥狀詞的疾病認知系統,其特征在于:認知模塊包括計算認知模塊,用于建立Jaccard系數相似性算法,設定相似性閾值,通過Jaccard系數相似性算法計算待識別癥狀特征詞與癥狀特征信息之間的相似性,將該相似性與相似性閾值進行比較,當相似性大于相似性閾值時,生成對應的認知報告。
6.一種基于主要癥狀與伴隨癥狀詞的疾病認知設備,其特征在于,所述基于主要癥狀與伴隨癥狀詞的疾病認知設備包括:
數據獲取單元,用于獲取疾病特征信息以及對應癥狀特征信息,根據該疾病特征信息以及對應的癥狀特征信息建立疾病知識數據庫;
數據獲取單元包括數據集建立模塊,用于獲取疾病特征信息以及對應的癥狀特征信息,所述疾病特征信息包括:疾病特征詞,癥狀特征信息包括:主要癥狀特征詞以及伴隨癥狀特征詞,根據疾病特征信息以及該癥狀特征信息建立不同的特征詞集合,包括:疾病特征詞集合、主要癥狀特征詞集合以及伴隨癥狀特征詞集合;
數據獲取單元還包括數據庫建立模塊,用于根據疾病特征信息以及對應癥狀特征信息之間的對應關系建立疾病特征信息與對應癥狀特征信息的關系表,將該特征詞集合與關系表組合,作為疾病知識數據庫;
特征提取單元,用于獲取待識別臨床癥狀特征信息,通過TF-IDF從待識別臨床癥狀特征信息中提取疾病特征分詞以及對應的癥狀特征分詞,根據該疾病特征分詞以及對應的癥狀特征分詞獲取待識別疾病特征詞以及對應的待識別癥狀特征詞,待識別臨床癥狀特征信息包括臨床主癥狀與伴隨癥狀特征信息;
匹配單元,用于將待識別疾病特征詞與疾病特征信息進行匹配,獲取待識別疾病特征詞與疾病特征信息之間的匹配相似度,根據該匹配相似度從疾病知識數據庫中查找與疾病特征信息對應的癥狀特征信息,得出相應類別疾病;
認知單元,用于建立Jaccard系數相似性算法,在得出的相應類別疾病的基礎上,通過Jaccard系數相似性算法計算待識別癥狀特征詞中的伴隨癥狀特征信息與癥狀特征信息中的伴隨癥狀特征信息之間的相似性,并生成對應認知報告,得出相應類別疾病。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢東湖大數據交易中心股份有限公司,未經武漢東湖大數據交易中心股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010876663.5/1.html,轉載請聲明來源鉆瓜專利網。





