[發明專利]一種基于大數據的血液病智能分類系統在審
| 申請號: | 201711376232.7 | 申請日: | 2017-12-19 |
| 公開(公告)號: | CN107945871A | 公開(公告)日: | 2018-04-20 |
| 發明(設計)人: | 袁斌;趙鵬;駱英華 | 申請(專利權)人: | 貴州醫科大學附屬醫院 |
| 主分類號: | G16H50/20 | 分類號: | G16H50/20;G16H50/70;G06F17/30 |
| 代理公司: | 北京國坤專利代理事務所(普通合伙)11491 | 代理人: | 趙紅霞 |
| 地址: | 550002 貴*** | 國省代碼: | 貴州;52 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 數據 血液病 智能 分類 系統 | ||
1.一種基于大數據的血液病智能分類系統,其特征在于,所述基于大數據的血液病智能分類系統包括:信息輸入模塊、服務器、數據采集模塊、數據存儲模塊、數據分割模塊、特征病理信息提取模塊、數據預處理模塊、特征數據生成模塊、病例數據庫檢索模塊;病例分類模塊;病例生成模塊、數據顯示模塊。
所述服務器包括數據采集模塊、數據存儲模塊、數據分割模塊、特征病理信息提取模塊、數據預處理模塊、特征數據生成模塊、病例數據庫檢索模塊;病例分類模塊;病例生成模塊;所述數據采集模塊、數據存儲模塊、所述數據分割模塊、特征病理信息提取模塊、數據預處理模塊、特征數據生成模塊、病例數據庫檢索模塊;病例分類模塊;病例生成模塊依次首尾電連接;
所述數據采集模塊數據聚合方法的步驟如下:
步驟一,在面積為S=LL的部署區域內,隨機分布N個同構的無線傳感器節點,sink節點位于部署區域之外,節點處理整個無線傳感器網絡內收集到的數據;
步驟二,非均勻成簇
sink節點位于部署區域的上方;首先部署區域X軸劃分為S個泳道,所有泳道有相同的寬度w,并且每個泳道的長度與部署區域的長度相等;用從1到s作為泳道的ID,最左端的泳道的ID為1,然后每個泳道沿著y軸劃分為多個矩形網格,每個泳道中的每個網格都被定義一個水平,最下端的網格的水平為1,每個網格和每個泳道有相同的寬度w;每個泳道中網格的個數、長度與泳道到sink的距離有關;通過設置網格的長度來調整網格的大小;針對不同的泳道,距離sink越遠的泳道含有的網格數目越小;針對同一泳道,距離sink越遠的網格的長度越大;假設A中含有S個元素,第k個元素表示在第k個泳道中網格的數目;每個網格用一個數組(i,j)作為ID,表示第i個泳道有水平j;定義S個數組表示網格的長度,第v個數組Hv表示第v個泳道中網格的長度,并且Hv的第w個元素hvw表示網格(v,w)的長度;網格(i,j)的邊界為:
o_x+(i-1)×w<x≤o_x+i×w
非均勻網格劃分好之后進行成簇階段;算法分為很多輪進行,在每輪中選取每個網格中剩余能量最大的節點作為簇首節點,其余節點根據就近原則加入簇,然后再進行數據聚合;
步驟三,格拉布斯預處理
傳感器節點需要對收集的數據進行預處理,然后再向簇首節點傳輸數據;采用格拉布斯預準則對傳感器節點所采集到的數據進行預處理假設某個簇首節點含有個傳感器節點,傳感器節點收集到的數據為x1,x2,…,xn,服從正態分布,并設:
根據順序統計原理,計算格拉布斯統計量:
給定顯著性水平(α=0.05)之后,測量值滿足gi≤g0(n,α),則認為測量值有效,測量值參與到下一層次的數據聚合;反之,則認為測量值無效,因此需要剔除,即不參與到下一層次的數據聚合;
步驟四,自適應聚合算法
通過迭代得到各個節點測量數據的無偏估計值,求取各個傳感器節點的測量數據值與估計值之間的歐式距離,以歸一化的歐式距離作為自適應加權融和的權值;選用簇中的傳感器節點采集到的數據的最大值與最小值的平均值作為中心數據;
某個簇中有個傳感器節點,用維列向量D=(d1,d2,…,dn)表示相應節點的測量值,通過計算各個節點數據與中心數據的歐式距離反應不同節點數據與中心數據之間的偏差大小,其中li的計算公式為:
根據歐式距離自適應設定相應的權值大小,距離越大權值越小,距離越小權值越大;
其中wi為相應的權值;
所述數據存儲模塊數據壓縮方法的步驟為:
步驟一、在編碼時,首先根據E1n+1=E1n+dn+1式計算出E1值,再根據和式計算出擬合殘差,計算這兩步時,均需要對結果進行越限判斷,判斷E1是否越限是為了避免超過傳感器數據總線上限而造成溢出;判斷殘差是否越限是為實現分段擬合;
步驟二、當一段輸入數據的擬合殘差全部計算完后,就構造出{dn,E1n,DFR3,DFR4,…DFRn}所示的數據包,通過S-Huffman編碼方法對進行熵編碼,然后發送出去,接收端解碼時,先將接收到的一組數據解碼,還原出{dn,E1n,DFR3,DFR4,…DFRn}式所示的數據包,然后根據式計算并還原出所有原始數據;
所述信息輸入模塊可以輸入病人血液信息,輸入的病人信息依次進入到數據采集模塊、數據存儲模塊、數據分割模塊、特征病理信息提取模塊、數據預處理模塊、特征數據生成模塊、病例數據庫檢索模塊;病例分類模塊;病例生成模塊中,生成的病例輸入到數據顯示模塊以自動生成病例分類;
所述病例分類模塊的多源異構數據語義集成模型包括:局部本體構建模塊、本體合并模塊和語義查詢動態擴展及規約模塊;
局部本體構建模塊,根據數據源特征,自適應地選擇本體構建策略,從而構建出油氣勘探局部本體;
本體合并模塊,與局部本體構建模塊連接,采用將概念匹配和屬性匹配相結合的本體合并方法,利用最大信息系數(MIC)方法計算概念語義相似度和概念屬性的語義相似度,實現多個局部本體到領域本體的靈活合并;
語義查詢動態擴展及規約模塊,與局部本體構建模塊連接,用于查詢請求動態擴展的有效性及結果的聚合優化;
局部本體構建模塊,根據數據源特征,通過自適應本體構建策略,進行局部本體的構建,具體包括:
步驟一、基于非結構化數據源構建局部本體:
首先,應用文本過濾器將不同的文件格式轉成為純文本文件格式,獲得語料數據,并進行一致性檢查;然后,采用逆向最大分類中文分詞方法對這些語料進行初步的切分處理,得到字串集合;然后,利用最大信息系數(MIC)方法計算字串的內部結合強度,獲取合成詞集合,并判斷合成詞和非合成詞的領域相關性,提取出概念集合;然后,應用圖上隨機游走算法推理合成詞概念間的分類關系,采用基于隱Markov模型(HMM)的聚類算法提取非合成詞概念間的分類關系;接著,運用基于關聯規則挖掘的方法獲取概念間的非分類關系;最后,應用本體構建工具輸出OWL格式的局部本體;
步驟二,基于結構化數據源構建局部本體:
首先,利用R2O技術建立數據庫模式和本體模型之間的語義映射關系,從而把關系數據庫中的關系映射為本體中的概念,把屬性對應地映射為OWL屬性,并把數據庫的關系表轉化為本體類,把數據庫中的數據轉化為實例;然后,對從數據庫中抽取出來的初始局部本體做一系列的規范化工作,通過與標準本體進行語義相似度計算,將符合閾值的本體信息建立語義聯系,不符合閾值的本體信息進行規范化處理,從而構建出符合要求的規范化局部本體;
步驟三,基于半結構化數據源構建局部本體
由于半結構化數據是介于結構化和非結構化數據之間的、具有隱含結構但缺乏固定或嚴格結構的一類數據;所以,基于上述兩種數據類型的本體構建技術也可以應用到半結構化數據源;首先,抽取出半結構化數據模式,給定映射規則,利用XML2RD方法,將半結構化數據轉化為結構化數據;然后,按照結構化數據構建局部本體的方法構造半結構化數據源對應的局部本體;
本體合并模塊合并的方法為:
采用將概念匹配和屬性匹配相結合的本體合并方法,利用最大信息系數(MIC)方法計算概念語義相似度和概念屬性的語義相似度,然后,通過相似度評估函數對概念間的相似度進行評估,輸出相似矩陣,并對相似矩陣運用領域公理約束知識進一步評估其相似性;接著,通過機器學習的方法訓練學習分類器,利用學習分類器計算概念實例間的相似度;最后,通過結合ISO15926油氣本體和模糊形式概念分析方法,綜合考慮語義相似度的對稱性和傳遞性關系,將模糊集理論引入語義相似度的設定中,實現多個局部本體到領域本體的靈活合并;
語義查詢動態擴展及規約模塊實現的具體方法為:
首先,借助社會標注語義分析和本體包含的概念關系及推理能力,對查詢請求進行語法及語義上的規約與擴展,生成規范的語義查詢語句,解決查詢請求與領域本體數據源之間由于表達形式的不同所造成的失配問題,并根據用戶的查詢請求自動推薦一簇語義相關標簽,為實現數據源準確聚集提供導引;然后,通過計算擴展查詢請求和領域本體概念間的語義相似度來量化請求與資源概念間的關聯度;最后,利用社會標注和本體包含的豐富概念語義關系,對查詢結果模式進行語義注釋,根據社會標注的語義全局效應,引入以統計分析結果獲得的最相關可信性標注所指向的數據源作為查詢結果可信性評價標準之一,對結果集進行去重和聚合優化,實現可信的Top-K查詢。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于貴州醫科大學附屬醫院,未經貴州醫科大學附屬醫院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711376232.7/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





