[發(fā)明專利]一種癌癥領域互動數(shù)據(jù)分析系統(tǒng)在審
| 申請?zhí)枺?/td> | 201910601908.0 | 申請日: | 2019-07-05 |
| 公開(公告)號: | CN110299210A | 公開(公告)日: | 2019-10-01 |
| 發(fā)明(設計)人: | 韓宗婧 | 申請(專利權)人: | 韓宗婧 |
| 主分類號: | G16H70/00 | 分類號: | G16H70/00;G06F16/33;G06F16/35 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 138000 *** | 國省代碼: | 吉林;22 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 癌癥 分析系統(tǒng) 互動數(shù)據(jù) 領域研究 文本 數(shù)據(jù)傳送系統(tǒng) 病歷信息 病人數(shù)據(jù) 處理系統(tǒng) 互動系統(tǒng) 決策系統(tǒng) 內(nèi)容分析 文本集合 文獻集合 向量化 計算機系統(tǒng) 構(gòu)建 對調(diào) 挖掘 | ||
1.一種癌癥領域互動數(shù)據(jù)分析系統(tǒng),其特征在于,包括以下步驟:
包括計算機系統(tǒng),病歷信息系統(tǒng),病人數(shù)據(jù)分析系統(tǒng),數(shù)據(jù)傳送系統(tǒng)、文獻互動系統(tǒng),輔助構(gòu)建處理系統(tǒng)和醫(yī)患決策系統(tǒng);計算機系統(tǒng)以癌癥為關鍵詞收集原始文獻文本集合,提取所述原始文獻文本集合中每個文獻的發(fā)表時間信息;數(shù)據(jù)傳送系統(tǒng)用于每個文獻響應通信,并建立不同的文獻文本歸類;患者數(shù)據(jù)處于計算機系統(tǒng)設定的集合時稱為初始狀態(tài)集,數(shù)據(jù)傳送系統(tǒng)采用這種方式能快速建立每個文獻文本的集合,病歷信息系統(tǒng)將原始文獻文本集合按照多個時間段進行歸類,并獲取所述時間段內(nèi)的原始文獻文本的原始關鍵詞,所述原始關鍵詞為所述原始文獻文本中出現(xiàn)頻次超過設定閾值的詞;病歷信息系統(tǒng)包括醫(yī)患互動單元和病情歸類單元,所述病情須知單元的執(zhí)行時間設置為每個月歸類,執(zhí)行過程為:所述病情須知單元查詢計算機系統(tǒng)處理的最近一次文獻狀態(tài)信息,導出與當前時間的間隔超過36個月的患者狀態(tài)信息作為文獻狀態(tài)收錄目標,醫(yī)患互動單元就是與所述需要設定的治療方案,啟動后所述病情須知單元查詢計算機系統(tǒng)中的癌癥領域數(shù)據(jù)并導出對應的文獻,將所述對應的號碼和編輯好的內(nèi)容導入到信息群發(fā)平臺,群發(fā)醫(yī)患互動內(nèi)容;病人數(shù)據(jù)分析系統(tǒng)對所述原始關鍵詞進行文本計算得到所述癌癥關鍵詞;將所述癌癥關鍵詞保存成特定的文本格式作為關鍵信息進行存儲,建立癌癥領域文本集合;文獻互動系統(tǒng)對所述癌癥領域文本集合進行計算;所述計算過程包括:格式轉(zhuǎn)換,文本預處理和詞典構(gòu)建;數(shù)據(jù)傳送系統(tǒng)對醫(yī)患所需癌癥領域研究文獻進行所述格式轉(zhuǎn)換,過濾掉其文本的結(jié)構(gòu)信息;文本預處理包括分詞、去停用詞、歸一化、詞干提取;對文本進行所述分詞處理,以空格、標點符號、段落為分割符,將文獻的文本分隔成獨立的單詞;對文本進行所述去停用詞處理,刪除文獻的文本中沒有意義的所述單詞,包括助動詞、介詞、連接詞和感嘆詞;對文本進行述歸一化處理,將表達相同語義但是拼寫格式不同的單詞統(tǒng)一形式;所述歸一化方法包括統(tǒng)一字母大小寫、去掉重音和音調(diào)符號;對文本進行詞干提取,將詞項簡化為詞干形式;輔助構(gòu)建處理系統(tǒng)對文本進行所述詞典構(gòu)建,建立癌癥相關術語的單詞集合;并將醫(yī)患所需癌癥領域研究文獻向量化:將醫(yī)患所需癌癥領域研究文獻視作由n個所述單詞組成的向量di,di=(di1,di2,...,din),i為整數(shù),每個單詞對應一個特征項,第j個單詞對應特征項tj;dij通過公式一計算:
公式一:
其中,dij為所述向量di在第j個維度的分量,csij為所述特征項tj在醫(yī)患中所需的第i篇文獻中出現(xiàn)的次數(shù);所述csin為第i篇文獻中總單詞數(shù):Z表示醫(yī)患中所需領域研究文獻集合中醫(yī)患所需癌癥領域研究文獻的總數(shù),Zj表示包含所述特征項tj的醫(yī)患所需癌癥領域研究文獻的數(shù)目;
每個特征項tj對應一個偏重wij,表示所述特征項tj在該醫(yī)患所需癌癥領域研究文獻中的重要程度,偏重wij通過公式二計算:
公式二:
其中,所述wij的值為所述第i篇文獻的所述特征項tj的偏重,csij為所述特征項tj在所述第i篇文獻中出現(xiàn)的次數(shù);Z表示醫(yī)患所需癌癥領域研究文獻集合中醫(yī)患所需癌癥領域研究文獻的總數(shù),smij為醫(yī)患所需癌癥領域研究文獻集合中,包含特征項tj的醫(yī)患所需癌癥領域研究文獻的數(shù)目;i、j和n均為正整數(shù),j≤n;
醫(yī)患決策系統(tǒng)求取醫(yī)患所需癌癥領域研究文獻集合的調(diào)看文本類,在向量空間模型中,兩個醫(yī)患所需癌癥領域研究文獻d1和d2之間的通用度通過公式三計算:
公式三:
其中,T(d1,d2)為兩個醫(yī)患所需癌癥領域研究文獻d1和d2之間的通用度,d1j、d2j分別表示醫(yī)患所需癌癥領域研究文獻d1和d2第j個維度的分量;j和n均為正整數(shù),j≤n;
醫(yī)患決策系統(tǒng)計算醫(yī)患所需癌癥領域研究文獻集合中,所有醫(yī)患所需癌癥領域研究文獻兩兩之間的所述通用度,求取醫(yī)患所需癌癥領域研究文獻與其他各個醫(yī)患所需癌癥領域研究文獻的所述通用度的平均值,將所述平均值最小的醫(yī)患所需癌癥領域研究文獻作為調(diào)看文本類;醫(yī)患決策系統(tǒng)對所述調(diào)看文本類進行內(nèi)容分析,實證分析,熱度分析以及效果分析,并進行深層的知識發(fā)現(xiàn)。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于韓宗婧,未經(jīng)韓宗婧許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910601908.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





