[發(fā)明專利]一種針對臨床檢測數(shù)據(jù)缺失問題的數(shù)據(jù)處理方法有效
| 申請?zhí)枺?/td> | 202010982079.8 | 申請日: | 2020-09-17 |
| 公開(公告)號: | CN112183723B | 公開(公告)日: | 2022-07-05 |
| 發(fā)明(設計)人: | 趙世杰;郭廣宇;劉卓妍;韓軍偉;郭雷 | 申請(專利權)人: | 西北工業(yè)大學 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/063;G06F17/16;G06N3/08 |
| 代理公司: | 西安凱多思知識產(chǎn)權代理事務所(普通合伙) 61290 | 代理人: | 王鮮凱 |
| 地址: | 710072 *** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 針對 臨床 檢測 數(shù)據(jù) 缺失 問題 數(shù)據(jù)處理 方法 | ||
本發(fā)明涉及一種針對臨床檢測數(shù)據(jù)缺失問題的數(shù)據(jù)處理方法,是基于有缺失數(shù)據(jù)的臨床檢測結果,使用自編碼神經(jīng)網(wǎng)絡來實現(xiàn)智能化的臨床數(shù)據(jù)處理。首先編碼器將每個檢測項目的數(shù)據(jù)結果進行編碼,由于每個檢測項目不同的患者數(shù)據(jù),最終得到維度不確定的編碼矩陣。然后通過矩陣運算將不定維度的編碼矩陣轉(zhuǎn)化為相同維度的向量,從而能夠使用神經(jīng)網(wǎng)絡來進行解碼,對缺失檢測數(shù)據(jù)給與彌補。通過在編碼器和解碼器之間插入巧妙設計的矩陣運算,所提出的方法成功消除了臨床檢測數(shù)據(jù)維度不定問題,使得神經(jīng)網(wǎng)絡來可以被用來處理有大量缺失臨床檢測數(shù)據(jù)的處理。
技術領域
本發(fā)明屬于計算機輔助診斷領域,涉及一種針對臨床檢測數(shù)據(jù)缺失問題的數(shù)據(jù)處理方法,具體涉及利用自編碼神經(jīng)網(wǎng)絡處理存在大量缺失的臨床檢測數(shù)據(jù)的方法,可應用于基于簡單臨床檢測的疾病的數(shù)據(jù)處理問題。
背景技術
相比于復雜的檢測手段如X光、核磁共振等醫(yī)學檢測手段,常規(guī)的臨床檢測如血液檢測、尿液檢測等存在檢測時間短、成本低等優(yōu)點。在很多醫(yī)療設備欠缺的不發(fā)達的國家和地區(qū),以及面對諸如新型冠狀病毒(COVID-19)之類的流行病,由于檢測設施的短缺或者突然增長的患者數(shù)量,血液檢測、尿液檢測等數(shù)據(jù)獲取遠比核磁共振、核酸檢測容易。因此基于常規(guī)臨床檢測數(shù)據(jù)的計算機輔助診斷方法對于提高不發(fā)達地區(qū)的醫(yī)療水平,以及遏制流行病的快速發(fā)展具有重大意義。然而,不同患者所進行臨床檢測的項目往往存在很大的差異,導致數(shù)據(jù)缺失成為臨床數(shù)據(jù)中常見的問題。
近年來,隨著人工智能領域的快速發(fā)展,使用神經(jīng)網(wǎng)絡的方法進行人工智能輔助診斷具有重大的應用前景。但神經(jīng)網(wǎng)絡使用的前提要求輸入數(shù)據(jù)的維度保持穩(wěn)定。JanusChristian Jakobsen等人在2017年發(fā)表的When and how should multiple imputationbe used for handling missing data in randomised clinical trials–a practicalguide with flowcharts證明對于缺失大于40%的臨床檢測數(shù)據(jù),利用統(tǒng)計學方法填充缺失項的方法會引入大量噪聲導致性能下降。但是直接移除未檢測的項目則會導致每個患者檢測數(shù)據(jù)維度不定,導致難以直接使用神經(jīng)網(wǎng)絡進行診斷。
發(fā)明內(nèi)容
要解決的技術問題
為了避免現(xiàn)有技術的不足之處,本發(fā)明提出一種針對臨床檢測數(shù)據(jù)缺失問題的數(shù)據(jù)處理方法,在經(jīng)典的自編碼神經(jīng)網(wǎng)絡結構中,通過矩陣運算將數(shù)據(jù)維度變化的矩陣轉(zhuǎn)化為維度確定的向量,同時保留原始數(shù)據(jù)的有效信息且不引入額外噪聲,以此成功將神經(jīng)網(wǎng)絡的方法應用到檢測數(shù)據(jù)存在缺失的彌補之中。
技術方案
一種針對臨床檢測數(shù)據(jù)缺失問題的數(shù)據(jù)處理方法,其特征在于步驟如下:
步驟1、構建網(wǎng)絡結構,參數(shù)進行隨機初始化:采用包含一個編碼器和一個解碼器的自動編碼器的結構,預先設定編碼后的特征向量長度是一個固定數(shù)值L,編碼器由兩個全連接層實現(xiàn),第一個全連接層后使用ReLu激活函數(shù);解碼器由兩個全連接層實現(xiàn),第一個全連接層后使用了ReLu激活函數(shù),第二個全連接層后使用Dropout,以及Sigmoid激活函數(shù);
步驟2、構建訓練數(shù)據(jù):所有數(shù)據(jù)共包含K個檢測項目,1≤N≤K個項目來自于患者的檢測,將該數(shù)據(jù)處理為一個1×(K+1)維的向量,其中前1×K維是項目編號,第i個項目則第i位置為1,其他位置為0;向量的最后一位是該項目的檢測結果;對每一個患者數(shù)據(jù),給定標簽y,y=1代表患病,y=0代表沒有患病;
步驟3、進行網(wǎng)絡訓練得到優(yōu)化后的神經(jīng)網(wǎng)絡:
步驟3a:給定一個檢測了N個項目的患者數(shù)據(jù),編碼器對每一個檢測項目的數(shù)據(jù)進行編碼,得到一系列的編碼向量{d1,…,dj,…dN},1≤j≤N,每一個編碼向量的維度是1×L;
步驟3b:利用公式得到一個1×L維的向量v,其中代表向量加法;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西北工業(yè)大學,未經(jīng)西北工業(yè)大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010982079.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種減少U型螺栓變形的壓扁模具
- 下一篇:一種能做色彩搭配的取色儀
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結構
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





