[發明專利]一種群智能尋優的肺癌癌細胞檢測儀在審
| 申請號: | 201810458506.5 | 申請日: | 2018-05-14 |
| 公開(公告)號: | CN108715804A | 公開(公告)日: | 2018-10-30 |
| 發明(設計)人: | 劉興高;高信騰;孫元萌 | 申請(專利權)人: | 浙江大學 |
| 主分類號: | C12M1/34 | 分類號: | C12M1/34 |
| 代理公司: | 杭州求是專利事務所有限公司 33200 | 代理人: | 邱啟旺 |
| 地址: | 310058 浙江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 尋優 種群 癌細胞檢測 基因微陣列 數據預處理 智能 肺癌 排序 分類器參數 種群多樣性 參數尋優 分數計算 模型構建 排序模塊 輸出結果 準則函數 最優參數 基因 擾動 分類器 貢獻度 歸一化 適應度 再利用 讀入 算法 噪聲 刪除 優化 搜尋 輸出 檢測 改進 統計 | ||
本發明公開了一種群智能尋優的肺癌癌細胞檢測儀,該系統由基因微陣列讀入模塊、數據預處理及特征排序模塊、參數尋優模塊、模型輸出組成。系統首先將輸入的基因微陣列數據預處理,刪除噪聲以及歸一化,然后對剩余的各個基因進行重要性排序,通過統計分數計算相關性,再利用分類器準則函數計算貢獻度,將所有基因重要性進行排序。改進的優化方法在原始的智能尋優算法下加入了適應度檢測與種群擾動,能夠防止種群多樣性散失以及優化過程陷入局部最優。然后將搜尋到的最優參數作為分類器參數完成模型構建并輸出結果。系統具有很好的去相關性,精度高。
技術領域
本發明涉及基因微陣列數據應用技術領域,具體地,涉及一種群智能尋優的肺癌癌細胞檢測儀。
背景技術
基因芯片(genechip)(又稱DNA芯片、生物芯片)的原型是80年代中期提出的。基因芯片的測序原理是雜交測序方法,即通過與一組已知序列的核酸探針雜交進行核酸序列測定的方法,在一塊基片表面固定了序列已知的靶核苷酸的探針。然而,怎樣去研究如此眾多基因在生命過程中所擔負的功能就成了全世界生命科學工作者共同的課題。為此,建立新型雜交和測序方法以對大量的遺傳信息進行高效、快速的檢測、分析就顯得格外重要了。肺癌是發病率和死亡率增長最快,對人群健康和生命威脅最大的惡性腫瘤之一。近50年來許多國家都報道肺癌的發病率和死亡率均明顯增高,男性肺癌發病率和死亡率均占所有惡性腫瘤的第一位,女性發病率占第二位,死亡率占第二位。而肺癌的病因至今尚不完全明確。如何利用基因微陣列技術對肺癌進行快速高效準確建模,是當下一項十分具有意義的科研熱點。
發明內容
為了克服目前難以搜尋基因微陣列數據最優特征子集以及分類最佳參數的不足,本發明的目的在于提供一種群智能尋優的肺癌癌細胞檢測儀。
本發明解決其技術問題所采用的技術方案是:一種群智能尋優的肺癌癌細胞檢測儀,該系統由基因微陣列讀入模塊、數據預處理及特征排序模塊、參數尋優模塊、模型輸出模塊組成;其中:
基因微陣列讀入模塊讀入的是所有基因微陣列的類別標簽Y=[y1,y2,...,ym],其中yi=k,k∈(-1,1),以及所有樣本的基因微陣列表達值:
其中每一行xi代表一個樣本所有基因的表達值,對應的每一列xj代表一個基因在所有樣本中的表達值,下標i表示第i個樣本、總共m個,下標j表示第j個基因、總共n個。
數據預處理及特征排序模塊是對讀入的原始微陣列數據進行歸一化以及特征排序的處理過程。其中歸一化操作為:
其中,Min、Max分別為樣本基因表達值的最小值、最大值。而特征排序選擇使用每個基因對分類準確度的貢獻度打分來實現,通過定義一個貢獻度函數:
其中,α=[α1,...,αn],Hij=yiyjK(xi,xj),α為法向量對應的系數、H為中間矩陣,J為代價函數、I為單位矩陣、K為核函數、y為標簽值、x為樣本特征值,上標T表示矩陣的轉置、下標i、j分別表示第i個樣本和第j個基因。事實上,該式代表分類邊界大小的平方值,則有:
定義w為分類絕策面的法向量、w*為最優法向量、α為法向量對應的系數、α*最優法向量對應的系數。觀察上式,可以得到:各個特征的重要程度根據該特征對于這個代價函數的貢獻大小來決定,即每個特征的貢獻值為:其中,δ表示貢獻度。
在使用非線性核作為核函數的時候,一般可以如下近似計算:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江大學,未經浙江大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810458506.5/2.html,轉載請聲明來源鉆瓜專利網。





