[發明專利]生物醫學數據特征選擇方法及裝置、計算設備及存儲介質在審
| 申請號: | 202110393715.8 | 申請日: | 2021-04-13 |
| 公開(公告)號: | CN112908416A | 公開(公告)日: | 2021-06-04 |
| 發明(設計)人: | 宗欣露;劉詩芹;葉志偉;王春枝;劉偉 | 申請(專利權)人: | 湖北工業大學 |
| 主分類號: | G16B20/30 | 分類號: | G16B20/30;G06K9/62;G06N3/12 |
| 代理公司: | 上海碩力知識產權代理事務所(普通合伙) 31251 | 代理人: | 楊用玲 |
| 地址: | 430000 湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 生物醫學 數據 特征 選擇 方法 裝置 計算 設備 存儲 介質 | ||
本發明提供了一種生物醫學數據特征選擇方法,包括:提取生物醫學數據集中的特征構成原始特征集合;根據所述原始特征集合,對種群進行初始化得到初始種群,并設置生物醫學數據特征選擇所需的參數;將初始種群中的個體映射為相應的特征組合,通過適應度函數計算種群中個體的適應度值;利用輪盤賭選擇對所述初始種群進行三系種群的劃分,分別隨機從不育系和保持系中選擇個體作為父本和母本進行雜交操作;隨機選擇恢復系中的個體進行自交操作;當達到最大自交次數時,對恢復系個體進行重置操作,在搜索空間中隨機選擇一組基因序列替換原始個體,并將自交次數歸0;判斷是否滿足終止條件,輸出全局最優的個體。
技術領域
本發明涉及數據挖掘技術領域,尤指一種生物醫學數據特征選擇方法及裝置、計算設備及存儲介質。
背景技術
近年來,隨著基因組測序技術的快速發展,積累了大量基因微陣列數據,對這些生物醫學數據進行挖掘和分析,可以為疾病診斷和防治工作帶來有效幫助。然而,由于原始數據中存在大量的噪聲和冗余特征,并且過多的特征會帶來維數災難的問題,因此,需要對生物醫學數據進行特征選擇從而挖掘出對分類最有效的特征。
特征選擇是機器學習與數據挖掘中的重要一步,屬于數據預處理部分。特征選擇是從原始數據集的特征中選擇出滿足某種評估標準的最優特征組合的過程,其目的是降低特征空間的維數、簡化學習模型、縮短學習時間和提高算法的性能,已有大量的研究表明了其有效性。通過從原始特征空間中篩選出有效的特征組合,排除大量無用特征,從而降低處理問題的難度。
為了達到更好的分類精度,許多研究者提出用智能優化算法來解決特征選擇問題,即初始化時隨機產生特征組合,特征組合的質量通過一定評價標準(適應度值函數)加以度量,通過不斷迭代更新特征組合使其向最優解靠攏,直到達到最大迭代次數或尋找到全局最優子集就輸出。解的形式為二進制編碼,編碼的長度等于原始數據中特征的維度,其中每一位用0或1表示該特征是否被選擇進入特征組合。
有學者將遺傳算法GA和分類器SVM相結合以選擇出分類精度較高的最優特征組合;粒子群優化算法PSO由于更新機制簡單易用已被成功用于醫學數據特征選擇和分類,但PSO容易陷入局部最優解。
盡管用于特征選擇的智能優化算法已取得很大的進展,但已有的算法或者得到解的優化程度低,或者計算量太大,遠未達到滿意的程度,因此,仍需要探索其他新的智能優化算法來解決特征選擇問題。
發明內容
本發明實施例的目的在于:為了克服現有生物醫學數據中特征選擇技術的不足,提出了一種基于輪盤賭機制水稻育種算法的生物醫學數據特征選擇方法,在保證分類精度的同時快速得到全局最優的特征組合。同時降低特征的維度,縮短訓練時間,簡化模型和提高分類器的精度,
本發明實施例所采用的技術方案如下:
一種基于輪盤賭機制水稻育種算法的生物醫學數據特征選擇方法,所述方法包括如下步驟:
S1.提取生物醫學數據集中的特征構成原始特征集合;
S2.根據所述原始特征集合,對種群進行初始化,并設置生物醫學數據特征選擇所需的參數;
S3.將初始種群中的個體映射為相應的特征組合,通過適應度函數計算種群中個體的適應度值;
S4.利用輪盤賭選擇進行三系種群的劃分,其中,適應度值處于第一閾值范圍的個體以第一概率選擇進入保持系,并以第二概率待選擇進入恢復系和不育系;
S5.分別隨機從不育系和保持系中選擇個體作為父本和母本進行雜交操作,即將父本和母本的基因通過重新組合產生新的基因序列,分別計算第一新個體和參與雜交的不育系個體的適應度值,從中選擇適應度值處于第二閾值范圍的個體的基因保留至下一代;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于湖北工業大學,未經湖北工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110393715.8/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





