[發(fā)明專利]一種醫(yī)療大數(shù)據(jù)分析處理系統(tǒng)及方法在審
| 申請(qǐng)?zhí)枺?/td> | 201710152265.7 | 申請(qǐng)日: | 2017-03-15 |
| 公開(公告)號(hào): | CN106874693A | 公開(公告)日: | 2017-06-20 |
| 發(fā)明(設(shè)計(jì))人: | 劉希;武洋;李建麗 | 申請(qǐng)(專利權(quán))人: | 國(guó)信優(yōu)易數(shù)據(jù)有限公司 |
| 主分類號(hào): | G06F19/00 | 分類號(hào): | G06F19/00 |
| 代理公司: | 北京青松知識(shí)產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙)11384 | 代理人: | 鄭青松 |
| 地址: | 100070 北京市豐臺(tái)區(qū)南*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 醫(yī)療 數(shù)據(jù) 分析 處理 系統(tǒng) 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及一種大數(shù)據(jù)分析處理系統(tǒng)及方法,具體涉及一種醫(yī)療大數(shù)據(jù)分析處理系統(tǒng)及方法。
背景技術(shù)
隨著網(wǎng)絡(luò)的日益普及和高速發(fā)展,各個(gè)行業(yè)的大數(shù)據(jù)都可以被收集到。針對(duì)大數(shù)據(jù)的挖掘已經(jīng)在其它行業(yè)有了很大程度的應(yīng)用并也有了很顯著的成果,但是與其它行業(yè)的應(yīng)用不同的是,醫(yī)療行業(yè)由于與病患的生命安全有著緊密的聯(lián)系,所以其分析結(jié)果的準(zhǔn)確性和實(shí)用性更是需要關(guān)注的重點(diǎn)。
發(fā)明內(nèi)容
針對(duì)上述技術(shù)問題,本發(fā)明的目的是對(duì)臨床大數(shù)據(jù)進(jìn)行分析和處理,以為常見的疾病并發(fā)癥進(jìn)行及時(shí)和準(zhǔn)備的預(yù)測(cè),為醫(yī)療診斷提供輔助支持。
本發(fā)明采用的技術(shù)方案為:
本發(fā)明的一實(shí)施例提供一種醫(yī)療大數(shù)據(jù)分析處理系統(tǒng),包括:數(shù)據(jù)采集模塊,采集關(guān)于需要預(yù)測(cè)的疾病并發(fā)癥的原始數(shù)據(jù),所述原始數(shù)據(jù)包括病人檢驗(yàn)指標(biāo)信息、病人檢驗(yàn)報(bào)告信息和病人就診記錄信息;數(shù)據(jù)預(yù)處理模塊,對(duì)采集的原始數(shù)據(jù)進(jìn)行清洗和集成;數(shù)據(jù)轉(zhuǎn)換模塊,對(duì)經(jīng)預(yù)處理后的數(shù)據(jù)利用熵進(jìn)行離散化處理,以得到為標(biāo)稱型數(shù)據(jù)的樣本集;預(yù)測(cè)模型構(gòu)建模塊,構(gòu)建用于訓(xùn)練的邏輯回歸模型,從經(jīng)數(shù)據(jù)轉(zhuǎn)換的樣本集中隨機(jī)抽取一份數(shù)據(jù)集作為訓(xùn)練集,并基于該訓(xùn)練集對(duì)構(gòu)建的邏輯回歸模型的參數(shù)進(jìn)行求解,以得到最終的預(yù)測(cè)模型;預(yù)測(cè)模型測(cè)試模塊,將樣本集中的另一份數(shù)據(jù)集作為測(cè)試集,利用得到的最終的預(yù)測(cè)模型進(jìn)行測(cè)試,以得到預(yù)測(cè)結(jié)果;預(yù)測(cè)結(jié)果評(píng)估模塊,采用多種評(píng)估度量對(duì)預(yù)測(cè)結(jié)果的準(zhǔn)確性進(jìn)行評(píng)估。
可選地,所述預(yù)測(cè)模型構(gòu)建模塊包括:矩陣構(gòu)建單元,將訓(xùn)練集中的m個(gè)樣本構(gòu)建為m×n型矩陣,n為訓(xùn)練樣本的n個(gè)指標(biāo);訓(xùn)練模型構(gòu)建單元,基于構(gòu)建的m×n型矩陣,構(gòu)建如下式(1)所示的邏輯回歸模型:
y=ΘTx=θ0*x0+θ1*x1+...+θn*xn(1)
其中,x=[x0,x1,...,xm]為矩陣中的n維向量,表示n種檢驗(yàn)指標(biāo)的結(jié)果,y表示診斷結(jié)果,在訓(xùn)練集中,當(dāng)病人患有該種疾病時(shí),取值為1,當(dāng)病人沒有患有該種疾病時(shí),取值為0,ΘT=[θ0,θ1,...,θm]為該n維向量的特征權(quán)重向量,為需要求解的模型參數(shù);
參數(shù)求解單元,利用極大似然函數(shù)對(duì)構(gòu)建的邏輯回歸模型的參數(shù)進(jìn)行求解,所述極大似然函數(shù)如下式(2)所示:
L(Θ)=∏g(ΘTx)y(1-g(ΘTx))1-y(2)
其中,g(ΘTx)為將回歸結(jié)果y二分化的激勵(lì)函數(shù),當(dāng)g(ΘTx)<T時(shí),y=0,即g(ΘTx)y=1,(1-g(ΘTx))1-y=(1-g(ΘTx)),當(dāng)g(ΘTx)≧T時(shí),y=1,即g(ΘTx)y=g(ΘTx),(1-g(ΘTx))1-y=1,T為基于期望分類結(jié)果所確定的閾值;
對(duì)上述公式(2)所示的極大似然函數(shù)兩端求導(dǎo)得到其對(duì)數(shù)似然函數(shù),如下式(3)所示:
l(Θ)=∑y*logg(ΘTx)+(1-y)*log(1-g(ΘTx))(3)
通過對(duì)上述公式(3)所示的對(duì)數(shù)似然函數(shù)的參數(shù)進(jìn)行求解,可得到用于訓(xùn)練的邏輯回歸模型的模型參數(shù),從而得到最終的預(yù)測(cè)模型。
可選地,采用梯度下降法來對(duì)所述對(duì)數(shù)似然函數(shù)的參數(shù)進(jìn)行求解,包括如下步驟:
(1)選擇梯度方向
(2)選擇下降步長(zhǎng)α,對(duì)參數(shù)進(jìn)行更新:
(3)重復(fù)以上步驟直至滿足停止條件;
其中,xi是投影到[0,1]之間的任意變量,yi是第i個(gè)樣本的真實(shí)值,yi*是該樣本的預(yù)測(cè)值,λ是防止模型過擬合的結(jié)構(gòu)化系數(shù)。
可選地,所述預(yù)測(cè)模型測(cè)試模塊基于最終的預(yù)測(cè)模型的決策函數(shù)來確定預(yù)測(cè)結(jié)果,所述決策函數(shù)如下式(4)所示:
其中,
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于國(guó)信優(yōu)易數(shù)據(jù)有限公司,未經(jīng)國(guó)信優(yōu)易數(shù)據(jù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710152265.7/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F19-00 專門適用于特定應(yīng)用的數(shù)字計(jì)算或數(shù)據(jù)處理的設(shè)備或方法
G06F19-10 .生物信息學(xué),即計(jì)算分子生物學(xué)中的遺傳或蛋白質(zhì)相關(guān)的數(shù)據(jù)處理方法或系統(tǒng)
G06F19-12 ..用于系統(tǒng)生物學(xué)的建模或仿真,例如:概率模型或動(dòng)態(tài)模型,遺傳基因管理網(wǎng)絡(luò),蛋白質(zhì)交互作用網(wǎng)絡(luò)或新陳代謝作用網(wǎng)絡(luò)
G06F19-14 ..用于發(fā)展或進(jìn)化的,例如:進(jìn)化的保存區(qū)域決定或進(jìn)化樹結(jié)構(gòu)
G06F19-16 ..用于分子結(jié)構(gòu)的,例如:結(jié)構(gòu)排序,結(jié)構(gòu)或功能關(guān)系,蛋白質(zhì)折疊,結(jié)構(gòu)域拓?fù)洌媒Y(jié)構(gòu)數(shù)據(jù)的藥靶,涉及二維或三維結(jié)構(gòu)的
G06F19-18 ..用于功能性基因組學(xué)或蛋白質(zhì)組學(xué)的,例如:基因型–表型關(guān)聯(lián),不均衡連接,種群遺傳學(xué),結(jié)合位置鑒定,變異發(fā)生,基因型或染色體組的注釋,蛋白質(zhì)相互作用或蛋白質(zhì)核酸的相互作用
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





