[發明專利]一種群智能尋優的肺癌癌細胞檢測儀在審
| 申請號: | 201810458506.5 | 申請日: | 2018-05-14 |
| 公開(公告)號: | CN108715804A | 公開(公告)日: | 2018-10-30 |
| 發明(設計)人: | 劉興高;高信騰;孫元萌 | 申請(專利權)人: | 浙江大學 |
| 主分類號: | C12M1/34 | 分類號: | C12M1/34 |
| 代理公司: | 杭州求是專利事務所有限公司 33200 | 代理人: | 邱啟旺 |
| 地址: | 310058 浙江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 尋優 種群 癌細胞檢測 基因微陣列 數據預處理 智能 肺癌 排序 分類器參數 種群多樣性 參數尋優 分數計算 模型構建 排序模塊 輸出結果 準則函數 最優參數 基因 擾動 分類器 貢獻度 歸一化 適應度 再利用 讀入 算法 噪聲 刪除 優化 搜尋 輸出 檢測 改進 統計 | ||
1.一種群智能尋優的肺癌癌細胞檢測儀,其特征在于:該系統由基因微陣列讀入模塊、數據預處理及特征排序模塊、參數尋優模塊、模型輸出模塊組成。
2.根據權利要求1所述群智能尋優的肺癌癌細胞檢測儀,其特征在于:所述基因微陣列讀入模塊讀入的是所有基因微陣列的類別標簽Y=[y1,y2,...,ym],其中yi=k,k∈(-1,1),以及所有樣本的基因微陣列表達值:
其中每一行xi代表一個樣本所有基因的表達值,對應的每一列xj代表一個基因在所有樣本中的表達值,下標i表示第i個樣本、總共m個,下標j表示第j個基因、總共n個。
3.根據權利要求1所述群智能尋優的肺癌癌細胞檢測儀,其特征在于:所述數據預處理及特征排序模塊對讀入的原始微陣列數據進行歸一化以及特征排序。其中歸一化操作為:
其中,Min、Max分別為樣本基因表達值的最小值、最大值。而特征排序選擇使用每個基因對分類準確度的貢獻度打分來實現,通過定義一個貢獻度函數:
其中,α=[α1,...,αn],Hij=yiyjK(xi,xj),α為法向量對應的系數、H為中間矩陣,J為代價函數、I為單位矩陣、K為核函數、y為標簽值、x為樣本特征值,上標T表示矩陣的轉置、下標i、j分別表示第i個樣本和第j個基因。事實上,該式代表分類邊界大小的平方值,則有:
定義w為分類絕策面的法向量、w*為最優法向量、α為法向量對應的系數、α*最優法向量對應的系數。觀察上式,可以得到:各個特征的重要程度根據該特征對于這個代價函數的貢獻大小來決定,即每個特征的貢獻值為:其中,δ表示貢獻度。
在使用非線性核作為核函數的時候,一般可以如下近似計算:
其中,合理假設某個特征消去之后α值不變,H(-i)表示該特征消去之后的H矩陣值。而在使用該假設時,得到的結果與線性核的結果相差不大。利用該式即可循環計算特征貢獻度進行基因重要性排序。由此,可得到基因檢測的訓練集合其中xi代表n×1的輸入特征向量,ti代表m×1的目標向量。給定一個激活函數g(x)以及隱含層的節點個數那么ELM基因檢測系統為:
其中,ωi代表第i個隱含層節點和輸入層之間的權重向量,bi代表第i個隱含層節點的偏置,βi代表第i個隱含層節點和輸出層之間的權重向量,oj代表第j個輸入數據的目標輸出。另外,ωi·xj代表了ωi和xj的內積。
該網絡的輸出能夠無限地接近于輸入的N個樣本,即:
可得:
上式可以表達為矩陣形式:Hβ=T
其中,H表示隱含層的輸出矩陣,H的第i列分別表示隱含層的第i個節點對應于N個輸入x1,x2,…,xN的輸出值。單隱層前饋神經網絡(SLFNs)的輸入權值和隱含層的偏差在網絡訓練的過程中不需要調整,可以任意給定。基于上述理論,輸出權重可以通過計算Hβ=T的最小二乘解求得:
可以利用線性方法快速求得方程的解,如式所示:
其中,代表H的Moore-Penrose廣義逆矩陣,代表最小范數最小二乘解,它正好是最小二乘解中范數最小的解。相比很多已有的基因檢測系統,極限學習機通過這種Moore-Penrose廣義逆的求解能夠以非常快的速度達到很好的訓練效果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江大學,未經浙江大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810458506.5/1.html,轉載請聲明來源鉆瓜專利網。





