[發明專利]一種基于確定性粒子群優化和支持向量機的腫瘤識別方法有效
| 申請號: | 201710122492.5 | 申請日: | 2017-03-03 |
| 公開(公告)號: | CN106971091B | 公開(公告)日: | 2020-08-28 |
| 發明(設計)人: | 韓飛;李佳玲;凌青華;周從華;崔寶祥;宋余慶 | 申請(專利權)人: | 江蘇大學 |
| 主分類號: | G16B40/20 | 分類號: | G16B40/20;G16B25/10;G06K9/62;G06N3/00 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 212013 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 確定性 粒子 優化 支持 向量 腫瘤 識別 方法 | ||
1.一種基于確定性粒子群優化和支持向量機的腫瘤識別方法,其特征在于,包括下列步驟:
步驟1腫瘤基因表達譜數據集的預處理,首先將腫瘤基因表達譜數據集劃分為訓練集和測試集,然后對數據集進行歸一化處理,獲取最終的關鍵基因子集;步驟2提出確定性粒子群優化算法IGPSO,在訓練集上,使用確定性粒子群優化算法優化支持向量機SVM;步驟3在測試集上,使用步驟2中優化得到的支持向量機SVM來對腫瘤基因表達譜數據集進行識別;
所述步驟2中使用確定性粒子群優化算法優化支持向量機SVM包含下列步驟:
步驟3.1:設定SVM的C,σ參數搜索空間,mi,min≤mi≤mi,max,其中懲罰因子C,核函數參數σ,mi為第i個參數的值,i表示參數個數,這里設置為2,算法開始時在搜索空間上隨意選擇一個參數值m;SVM的分類規則方程如式(7):
訓練集T{(xi,yi);xi∈Rn;yi=±1;i=1,2,...,r},其中:xi為訓練樣本,x為待判斷樣本,b為門限,αi是拉格朗日乘子,K(xi,x)為核函數;
支持向量機求解的最優化問題和所構建的分類決策函數如下:
其中K(x,xi)為核函數,xi為訓練樣本,b為門限,αi是拉格朗日乘子,其作用是將其特征空間映射到高維空間;在實際應用中,特征基因數量小,所以采用基于RBF的SVM分類器對腫瘤樣本進行分類,RBF表示如下:
步驟3.2:設置粒子群的大小為N,分類準確率要求為F,擴展因子為Ex,局域大小為w=[w1,w2],最大重試次數為Tmax,重試次數t和擴大因子開始為0;
步驟3.3:算法開始時根據初始化的搜索空間p=[p1,p2],按擴展因子Ex擴大搜索空間,按步驟3.4至3.7計算局域位置,使得局域落在搜索空間p+0.6Ex*w中;
步驟3.4:計算x對應的分類性能函數fp;
步驟3.5:以IGPSO算法尋找最優值,得出最優值對應的分類性能函數fc;
步驟3.6:若搜索到更好的分類率,即fp<fc,則t和Ex置為0,否則t=t+1;
步驟3.7:若t≥Tmax,則置t為0,Ex=Ex+1,此時有可能已陷入局部最優,增大搜索范圍以便跳出當前的局部區域;
步驟3.8:若達到分類準確率要求,即fp≤F,則輸出{C,σ}的值和分類準確率,算法結束,否則轉步驟3.3;
對支持向量機的兩個參數進行初始設置,其搜索范圍{0<C<16,0<σ<6},最大重試次數設置為10,C的擴大步長為0.3,σ的擴大步長為0.1,結合最終關鍵基因子集,用IGPSO算法對支持向量機的這兩個參數進行優化,IGPSO算法在局域內粒子按照性能函數的分類率對參數{C,σ}的梯度方向進行搜索,如果達到最大重試次數,未找到更好的分類率,則擴大搜索范圍。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于江蘇大學,未經江蘇大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710122492.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基因測序數據壓縮和傳輸方法
- 下一篇:基于云平臺的USB加密卡管理系統





