[發明專利]一種基于機器學習算法的精神性腦疾病預測模型建立方法在審
| 申請號: | 202211220974.1 | 申請日: | 2022-10-08 |
| 公開(公告)號: | CN115714026A | 公開(公告)日: | 2023-02-24 |
| 發明(設計)人: | 彭朋;烏梅杰;李初晴 | 申請(專利權)人: | 陜西科技大學 |
| 主分類號: | G16H50/50 | 分類號: | G16H50/50;G06N3/0475;G06N3/08 |
| 代理公司: | 西安智大知識產權代理事務所 61215 | 代理人: | 季海菊 |
| 地址: | 710021 陜西省*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 機器 學習 算法 精神 疾病 預測 模型 建立 方法 | ||
1.一種基于機器學習算法的精神性腦疾病預測模型建立方法,其特征在于:基于組信息指導的獨立成分分析(GIG-ICA)方法提取腦功能網絡;在此基礎上,采用生成式對抗神經網絡(GAN)生產模擬的全腦功能連接向量;最后,基于多層特征選擇,從真實和模擬的全腦功能連接向量中選擇對腦疾病預測具有高判別性的特征,構建腦疾病預測模型。
2.根據權利要求1所述的基于機器學習算法的精神性腦疾病預測模型建立方法,具體包括以下步驟:
步驟1、采用GIG-ICA方法提取腦功能網絡;
步驟2、基于步驟1提取腦功能網絡,采用生成式對抗神經網絡GAN生成模擬的全腦功能連接向量;
步驟3、基于多層特征選擇,從真實和模擬的全腦功能連接向量中選擇對腦疾病預測具有高判別性的特征,構建腦疾病預測模型。
3.根據權利要求2所述的基于機器學習算法的精神性腦疾病預測模型建立方法,其特征在于:所述步驟1的具體方法為:
使用GIG-ICA從fMRI數據中提取多個獨立成分(IC),其中每個IC都可以視為一個網絡節點;通過計算IC之間的相關性,構建全腦功能連接矩陣,以提取每個被試的全腦功能連接向量其中,l1表示樣本個數,p表示全腦功能連接向量的特征數目;
設S=(S1,S2,...,Sn)表示n個獨立源信號,X=(X1,X2,...,Xm)T表示m個觀測信號,一般情況nm,ICA模型表示為X=AS;假設A是方陣,W為A的逆矩陣,則S=WX;因ICA存在輸出成分不確定的缺陷,采用ICA的擴展模型GIG-ICA提取腦功能網絡,GIG-ICA優化目標函數如下:
s.t.||Wi||=1
其中,Wi是解混矩陣的第i列,是一個估計的獨立成分,X是fMRI數據可以看作觀測信號,υ是零均值單位方差的高斯變量,G是一個非二次函數,Ri是零均值單位方差后的參考信號,此處指組水平的獨立成分,φ{Yi,Ri}表示估計的獨立成分Yi和參考信號Ri的Pearson相關系數;
采用線性加權法,求解此多目標函數得到
s.t.||Wi||=1
其中,權重系數α調節IC的獨立性和估計信號與參考信號之間的相似性,利用梯度下降法根據獲得解混矩陣的列向量;此外,GIG-ICA定義了所求得的獨立成分對應的時間序列的特殊求法,實際是以估計所得獨立成分為權重的全腦體素時間序列的加權,即Ti=E(XYi)。
4.根據權利要求2所述的基于機器學習算法的精神性腦疾病預測模型建立方法,其特征在于:所述步驟2的具體方法為:
采用GAN生成多個模擬的全腦功能連接向量其中,l2表示GAN生成的全腦功能連接向量的樣本數,p表示每個樣本全腦功能連接向量的特征數;
GAN由生成器(G)和判別器(D)組成,其中生成器G(x;θ)通過學習真實數據的分布Pdata(x),將接收的隨機噪聲Z分布Pz(z)生成與真實數據x分布相同的假樣本Pg;判別器D(x;θd)負責接收數據,預測數據為真實的還是生成的,并將預測結果反饋回G和D,二者通過多次交叉迭代,最終其網絡參數達到納什平衡;GAN的優化問題公式如下:
5.根據權利要求2所述的基于機器學習算法的精神性腦疾病預測模型建立方法,其特征在于:所述步驟2的具體方法為:
將步驟1提取的真實數據和步驟2生成的數據組成新的數據集對Q進行多層特征選擇得到特征以去除冗余特征和噪聲的同時防止重要特征丟失,完成特征選擇之后,對P使用分類器對選中的特征進行分類,對精神性腦疾病進行最終的評估預測;所述多層特征選擇的具體步驟如下:
(1)選擇單變量的過濾法為第一層特征選擇;考慮自變量本身與目標變量之間的相關性對特征進行排序,即方差分析對特征進行第一層選擇;首先設定一個閾值,計算每個特征的方差,選擇超出閾值的特征作為第一個特征子集;
(2)選擇多變量的過濾法為第二層特征選擇;使用最小冗余最大相關(mRMR)算法對特征進行第二層選擇;用互信息作為相關性度量函數,依次搜索與類別最大相關且與其余特征之間冗余度最小的特征構成第二個特征集合;
兩個特征變量的互信息表示為:
其中x和y為特征變量;p(x)和p(y)為相應變量的邊際概率分布;p(x,y)是聯合概率分布;
給定候選特征變量,特征與類別標簽的最大相關定義式如下:
特征之間的最小冗余定義式如下:
其中L為特征集合;fi為第i個特征;c為特征所屬類別;I(fi,c)為特征i和目標類別c之間的互信息;I(fi,fj)為特征i和特征j之間的互信息;
mRMR特征選擇算法的評價函數如下:
maxJ(D,R),J=D-R
以上方程可以通過逐漸增加單個變量來求解,設L為特征全集,假設目前已經選擇了t個特征,記為Lt,下一步就要從L-Lt中繼續選擇的第t+1個特征,使得上式最大化,即選擇使得下式成立的第t+1個特征;
(3)選擇包裹法作為第三層特征選擇;使用基于支持向量機的遞歸特征消除算法(SVM-RFE)進行第三層特征選擇;所述基于支持向量機的遞歸特征消除算法(SVM-RFE)為二值分類器;SVM-RFE算法的輸入為:輸出為:特征排序集R;基本流程如下:
a)初始化訓練數據集:
b)初始化特征集L={1,2,...,F},特征排序集Rank=[]
c)循環以下步驟直到將特征集L=[];
d)使用訓練SVM分類器,得到特征權重ωi;
e)使用排序公式計算特征的排序得分,找出排序得分最小的特征
f)更新特征排序集R=[Fmin,R],并在特征集L中去除此特征;
g)循環結束,輸出選擇的特征;
(4)將第(3)步每一層特征被選擇的次數進行降序排列,根據權重分布特點刪除權重最小的特征,最終實現特征降維。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于陜西科技大學,未經陜西科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211220974.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種太陽能組件層壓機的超溫報警裝置及其使用方法
- 下一篇:電子元器件涂膠設備





