[發明專利]一種醫療大數據分析處理系統及方法在審
| 申請號: | 201710152265.7 | 申請日: | 2017-03-15 |
| 公開(公告)號: | CN106874693A | 公開(公告)日: | 2017-06-20 |
| 發明(設計)人: | 劉希;武洋;李建麗 | 申請(專利權)人: | 國信優易數據有限公司 |
| 主分類號: | G06F19/00 | 分類號: | G06F19/00 |
| 代理公司: | 北京青松知識產權代理事務所(特殊普通合伙)11384 | 代理人: | 鄭青松 |
| 地址: | 100070 北京市豐臺區南*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 醫療 數據 分析 處理 系統 方法 | ||
1.一種醫療大數據分析處理系統,其特征在于,包括:
數據采集模塊,采集關于需要預測的疾病并發癥的原始數據,所述原始數據包括病人檢驗指標信息、病人檢驗報告信息和病人就診記錄信息;
數據預處理模塊,對采集的原始數據進行清洗和集成;
數據轉換模塊,對經預處理后的數據利用熵進行離散化處理,以得到為標稱型數據的樣本集;
預測模型構建模塊,構建用于訓練的邏輯回歸模型,從經數據轉換的樣本集中隨機抽取一份數據集作為訓練集,并基于該訓練集對構建的邏輯回歸模型的參數進行求解,以得到最終的預測模型;
預測模型測試模塊,將樣本集中的另一份數據集作為測試集,利用得到的最終的預測模型進行測試,以得到預測結果;
預測結果評估模塊,采用多種評估度量對預測結果的準確性進行評估。
2.根據權利要求1所述的醫療大數據分析處理系統,其特征在于,所述預測模型構建模塊包括:
矩陣構建單元,將訓練集中的m個樣本構建為m×n型矩陣,n為訓練樣本的n個指標;
訓練模型構建單元,基于構建的m×n型矩陣,構建如下式(1)所示的邏輯回歸模型:
y=ΘTx=θ0*x0+θ1*x1+...+θn*xn(1)
其中,x=[x0,x1,...,xm]為矩陣中的n維向量,表示n種檢驗指標的結果,y表示診斷結果,在訓練集中,當病人患有該種疾病時,取值為1,當病人沒有患有該種疾病時,取值為0,ΘT=[θ0,θ1,...,θm]為該n維向量的特征權重向量,為需要求解的模型參數;
參數求解單元,利用極大似然函數對構建的邏輯回歸模型的參數進行求解,所述極大似然函數如下式(2)所示:
L(Θ)=∏g(ΘTx)y(1-g(ΘTx))1-y(2)
其中,g(ΘTx)為將回歸結果y二分化的激勵函數,當g(ΘTx)<T時,y=0,即g(ΘTx)y=1,(1-g(ΘTx))1-y=(1-g(ΘTx)),當g(ΘTx)≧T時,y=1,即g(ΘTx)y=g(ΘTx),(1-g(ΘTx))1-y=1,T為基于期望分類結果所確定的閾值;
對上述公式(2)所示的極大似然函數兩端求導得到其對數似然函數,如下式(3)所示:
l(Θ)=∑y*log g(ΘTx)+(1-y)*log(1-g(ΘTx))(3)
通過對上述公式(3)所示的對數似然函數的參數進行求解,可得到用于訓練的邏輯回歸模型的模型參數,從而得到最終的預測模型。
3.根據權利要求2所述的醫療大數據分析處理系統,其特征在于,采用梯度下降法來對所述對數似然函數的參數進行求解,包括如下步驟:
(1)選擇梯度方向
(2)選擇下降步長α,對參數進行更新:
(3)重復以上步驟直至滿足停止條件;
其中,xi是投影到[0,1]之間的任意變量,yi是第i個樣本的真實值,yi*是該樣本的預測值,λ是防止模型過擬合的結構化系數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國信優易數據有限公司,未經國信優易數據有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710152265.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:多孔混凝土配合比設計方法
- 下一篇:一種面向癲癇腦電信號識別的智能診斷系統
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





