[發明專利]一種群智能尋優的白血病癌細胞檢測儀在審
| 申請號: | 201810458511.6 | 申請日: | 2018-05-14 |
| 公開(公告)號: | CN108875305A | 公開(公告)日: | 2018-11-23 |
| 發明(設計)人: | 劉興高;高信騰 | 申請(專利權)人: | 浙江大學 |
| 主分類號: | G06F19/20 | 分類號: | G06F19/20;G06F19/24;G06N3/12;C12M1/34 |
| 代理公司: | 杭州求是專利事務所有限公司 33200 | 代理人: | 邱啟旺 |
| 地址: | 310058 浙江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 尋優 白血病癌細胞 基因微陣列 數據預處理 檢測儀 智能 排序 種群 模型輸出模塊 分類器參數 種群多樣性 參數尋優 分數計算 模型構建 排序模塊 輸出結果 在線檢測 準則函數 最優參數 基因 擾動 分類器 貢獻度 適應度 再利用 讀入 算法 優化 搜尋 檢測 改進 統計 | ||
1.一種群智能尋優的白血病癌細胞檢測儀,其特征在于:該系統由基因微陣列讀入模塊、數據預處理及特征排序模塊、參數尋優模塊、模型輸出模塊組成。
2.根據權利要求1所述群智能尋優的白血病癌細胞檢測儀,其特征在于:所述基因微陣列讀入模塊讀入所有基因微陣列的類別標簽Y=[y1,y2,...,ym],其中yi=k,k∈(-1,1),以及所有樣本的基因微陣列表達值:
其中每一行xi代表一個樣本所有基因的表達值,對應的每一列xj代表一個基因在所有樣本中的表達值,下標i表示第i個樣本、總共m個,下標j表示第j個基因、總共n個。
3.根據權利要求1所述群智能尋優的白血病癌細胞檢測儀,其特征在于:所述數據預處理及特征排序模塊對讀入的原始微陣列數據進行歸一化以及特征排序的處理過程。其中歸一化操作為:
其中,Min、Max分別為樣本基因表達值的最小值、最大值。而特征排序選擇使用每個基因對分類準確度的貢獻度打分來實現,在支持向量機理論中,通過定義一個貢獻度函數:
其中,α=[α1,...,αn],Hij=yiyjK(xi,xj),α為法向量對應的系數、H為中間矩陣,J為代價函數、I為單位矩陣、K為核函數、y為標簽值、x為樣本特征值,上標T表示矩陣的轉置、下標i、j分別表示第i個樣本和第j個基因。事實上,該式代表分類邊界大小的平方值,支持向量機的目標函數即是最小化它。在使用線性核作為支持向量機的核函數的情況下,則有:
其中,w*為最優支持向量、w為法向量、α*最優支持向量對應的系數。觀察上式,可以得到:各個特征的重要程度根據該特征對于這個代價函數的貢獻大小來決定,即每個特征的貢獻值為:其中,δ表示貢獻度。
在使用非線性核作為核函數的時候,一般可以如下近似計算:
其中,合理假設某個特征消去之后α值不變,H(-i)表示該特征消去之后的H矩陣值。而在使用該假設時,得到的結果與線性核的結果相差不大。利用該式即可循環計算特征貢獻度進行基因重要性排序。
對于一組訓練樣本集{xn,tn}(n=1,2,...N,x∈Rd,t∈{0,1}),其中x表示訓練樣本,t表示樣本時刻點。相關向量機的分類函數y(x;wr)定義為:
其中K(x,xi)是核函數,wri為權值,wr0為初始權值。將logistic sigmoid連接函數應用到原式,可得該數據集的似然概率p(t|wr)估計為:
其中,σ為方差,為了避免過擬合,相關向量機為每個wr設置了高斯先驗概率分布約束條件:
可以根據Laplace理論得到后驗概率的近似:首先固定α,求取的對應最大可能似然概率MP的權值wrMP,由于p(wr|t,α)正比于p(t|wr)p(wr|α),利用二階牛頓法求取wrMP:
其中,yn=σ{y(xn;wr)},A=diag(α0,α1,...,αN)。然后利用拉普拉斯方法,對上式進行二次求導可得:
其中,Φ是N×(N+1)的結構矩陣,Φ=[φ(x1),φ(x2),...,φ(xN),]T,φ(xn)=[1,K(xn,x1),K(xn,x2),...,K(xn,xN)]T,B=diag(β1,β2,...,βN),B是一個對角矩陣,βn=σ{y(Xn)}[1-σ{y(Xn)}]。對上式的右式取負號,然后求逆,可得協方差陣Σ。再之后,利用Σ和wrMP,對超參數α更新:
wrMP=ΣΦTBt
在迭代過程中,大部分的αi會接近于無窮大,因此它們相應的wri就無限趨近于0,可以刪去其基函數達到稀疏性。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江大學,未經浙江大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810458511.6/1.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





