[發(fā)明專利]一種基于主要癥狀與伴隨癥狀詞的疾病認(rèn)知系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 202010876663.5 | 申請(qǐng)日: | 2020-08-27 |
| 公開(公告)號(hào): | CN111985246B | 公開(公告)日: | 2023-08-15 |
| 發(fā)明(設(shè)計(jì))人: | 杜樂(lè);杜小軍 | 申請(qǐng)(專利權(quán))人: | 武漢東湖大數(shù)據(jù)交易中心股份有限公司 |
| 主分類號(hào): | G06F40/30 | 分類號(hào): | G06F40/30;G06F40/289;G06F40/216;G06F18/22;G16H15/00;G16H50/70 |
| 代理公司: | 武漢紅觀專利代理事務(wù)所(普通合伙) 42247 | 代理人: | 李季 |
| 地址: | 430000 湖北省武漢市東湖新技術(shù)開*** | 國(guó)省代碼: | 湖北;42 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 主要癥狀 伴隨 癥狀 疾病 認(rèn)知 系統(tǒng) | ||
本發(fā)明提出了一種基于主要癥狀與伴隨癥狀詞的疾病認(rèn)知系統(tǒng)。包括:數(shù)據(jù)獲取模塊,用于獲取疾病特征信息以及對(duì)應(yīng)癥狀特征信息,建立疾病知識(shí)數(shù)據(jù)庫(kù);特征提取模塊,用于獲取待識(shí)別臨床癥狀特征信息,獲取特征詞;匹配模塊,用于將待識(shí)別疾病特征詞與疾病特征信息進(jìn)行匹配,根據(jù)該匹配相似度從疾病知識(shí)數(shù)據(jù)庫(kù)中查找與疾病特征信息對(duì)應(yīng)的癥狀特征信息;認(rèn)知模塊,用于建立Jaccard系數(shù)相似性算法,計(jì)算待識(shí)別癥狀特征詞與癥狀特征信息之間的相似性,并生成對(duì)應(yīng)認(rèn)知報(bào)告。本發(fā)明通過(guò)關(guān)鍵詞匹配方法與Jaccard系數(shù)相似性定理構(gòu)建聯(lián)合認(rèn)知模型,通過(guò)聯(lián)合認(rèn)知模型精確對(duì)待識(shí)別疾病進(jìn)行認(rèn)知,提高系統(tǒng)的識(shí)別精確度,提升了用戶體驗(yàn)。
技術(shù)領(lǐng)域
本發(fā)明涉及計(jì)算機(jī)技術(shù)領(lǐng)域,尤其涉及一種基于主要癥狀與伴隨癥狀詞的疾病認(rèn)知系統(tǒng)。
背景技術(shù)
每個(gè)疾病都有其特定的病因和病理,特別是都有一定的發(fā)展演變規(guī)律,并且表現(xiàn)出不同的臨床癥狀特征信息。臨床癥狀特征信息是患者因疾病而表現(xiàn)出來(lái)的不正常狀態(tài)。每個(gè)人年齡、性別、體質(zhì)不同,即使患同一種疾病,其癥狀也不同。疾病初期、中期、晚期的癥狀,也呈現(xiàn)出階段性變化。
近年來(lái),相關(guān)專家開始研究通過(guò)臨床癥狀特征信息來(lái)推導(dǎo)和預(yù)測(cè)疾病的方法。比如,基于臨床癥狀的特征權(quán)重推導(dǎo)疾病概率方法等,但是這些方法對(duì)于人工依賴比較大,并且精確度不夠高,速度較慢,所以亟需一種基于主要癥狀與伴隨癥狀詞的疾病認(rèn)知系統(tǒng),能夠提高疾病認(rèn)知速度以及精確度。
上述內(nèi)容僅用于輔助理解本發(fā)明的技術(shù)方案,并不代表承認(rèn)上述內(nèi)容是現(xiàn)有技術(shù)。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明提出了一種基于主要癥狀與伴隨癥狀詞的疾病認(rèn)知系統(tǒng),旨在解決現(xiàn)有技術(shù)無(wú)法通過(guò)二次提取特征詞以及Jaccard系數(shù)相似性定理來(lái)提高疾病認(rèn)知的精確度的技術(shù)問(wèn)題。
本發(fā)明的技術(shù)方案是這樣實(shí)現(xiàn)的:
一方面,本發(fā)明提供了一種基于主要癥狀與伴隨癥狀詞的疾病認(rèn)知系統(tǒng),所述基于主要癥狀與伴隨癥狀詞的疾病認(rèn)知系統(tǒng)包括:
數(shù)據(jù)獲取模塊,用于獲取疾病特征信息以及對(duì)應(yīng)癥狀特征信息,根據(jù)該疾病特征信息以及對(duì)應(yīng)的癥狀特征信息建立疾病知識(shí)數(shù)據(jù)庫(kù);
特征提取模塊,用于獲取待識(shí)別臨床癥狀特征信息,通過(guò)TF-IDF從待識(shí)別臨床癥狀特征信息中提取疾病特征分詞以及對(duì)應(yīng)的癥狀特征分詞,根據(jù)該疾病特征分詞以及對(duì)應(yīng)的癥狀特征分詞獲取待識(shí)別疾病特征詞以及對(duì)應(yīng)的待識(shí)別癥狀特征詞;
匹配模塊,用于將待識(shí)別疾病特征詞與疾病特征信息進(jìn)行匹配,獲取待識(shí)別疾病特征詞與疾病特征信息之間的匹配相似度,根據(jù)該匹配相似度從疾病知識(shí)數(shù)據(jù)庫(kù)中查找與疾病特征信息對(duì)應(yīng)的癥狀特征信息;
認(rèn)知模塊,用于建立Jaccard系數(shù)相似性算法,通過(guò)Jaccard系數(shù)相似性算法計(jì)算待識(shí)別癥狀特征詞與癥狀特征信息之間的相似性,并生成對(duì)應(yīng)認(rèn)知報(bào)告。
在以上技術(shù)方案的基礎(chǔ)上,優(yōu)選的,數(shù)據(jù)獲取模塊包括數(shù)據(jù)集建立模塊,用于獲取疾病特征信息以及對(duì)應(yīng)的癥狀特征信息,所述疾病特征信息包括:疾病特征詞,癥狀特征信息包括:主要癥狀特征詞以及伴隨癥狀特征詞,根據(jù)疾病特征信息以及該癥狀特征信息建立不同的特征詞集合,包括:疾病特征詞集合、主要癥狀特征詞集合以及伴隨癥狀特征詞集合。
在以上技術(shù)方案的基礎(chǔ)上,優(yōu)選的,數(shù)據(jù)獲取模塊還包括數(shù)據(jù)庫(kù)建立模塊,用于根據(jù)疾病特征信息以及對(duì)應(yīng)癥狀特征信息之間的對(duì)應(yīng)關(guān)系建立疾病特征信息與對(duì)應(yīng)癥狀特征信息的關(guān)系表,將該特征詞集合與關(guān)系表組合,作為疾病知識(shí)數(shù)據(jù)庫(kù)。
在以上技術(shù)方案的基礎(chǔ)上,優(yōu)選的,特征提取模塊包括特征分詞提取模塊,用于獲取待識(shí)別臨床癥狀特征信息,所述待識(shí)別臨床癥狀特征信息包括:疾病文本描述以及對(duì)應(yīng)的癥狀文本描述,利用TF-IDF從待識(shí)別臨床癥狀特征信息中提取各個(gè)詞條的出現(xiàn)頻率數(shù)據(jù),設(shè)定出現(xiàn)頻率閾值,將各個(gè)詞條的出現(xiàn)頻率數(shù)據(jù)與出現(xiàn)頻率閾值進(jìn)行比較,將出現(xiàn)頻率數(shù)據(jù)大于出現(xiàn)頻率閾值的詞條作為特征分詞。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于武漢東湖大數(shù)據(jù)交易中心股份有限公司,未經(jīng)武漢東湖大數(shù)據(jù)交易中心股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010876663.5/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。





