[發明專利]一種基于粒子群優化的酵母菌多標記特征選擇方法及裝置在審
| 申請號: | 201810380973.0 | 申請日: | 2018-04-25 |
| 公開(公告)號: | CN108805162A | 公開(公告)日: | 2018-11-13 |
| 發明(設計)人: | 孫林;鄭瑞麗;張倩倩;申陳海;靳瑞霞;劉艷;王藍瑩;殷騰宇;趙婧;秦小營;王學敏 | 申請(專利權)人: | 河南師范大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 鄭州睿信知識產權代理有限公司 41119 | 代理人: | 符亞飛 |
| 地址: | 453007 *** | 國省代碼: | 河南;41 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 酵母菌 特征子集 粒子群優化 特征選擇 多標記 計算復雜度 時間復雜度 適應度函數 分類性能 候選特征 離散粒子 評價準則 數據集中 分類器 冗余性 子集 | ||
本發明涉及一種基于粒子群優化的酵母菌多標記特征選擇方法及裝置,通過酵母菌特征和標記之間的相關性、特征和特征之間的冗余性、標記和標記之間的相關性構造候選特征子集的評價準則函數,將其作為離散粒子群方法的適應度函數,從而從酵母菌數據集中選擇出最優的特征子集。本發明不僅可以有效的選取特征子集,為后續工作提供了一個精簡、準確的特征子集,而且,有效降低了分類器的時間復雜度和計算復雜度,提高了分類性能。
技術領域
本發明屬于數據處理技術領域,具體涉及一種基于粒子群優化的酵母菌多標記特征選擇方法及裝置。
背景技術
在傳統的監督學習框架中,每個學習對象有且僅有一個類別標記,且標記之間是相互排斥和獨立的。例如,在性別分類預測問題中,只存在“性別”一個標記,并且標記值要么是“男”要么是“女”,不存在標記值重疊的情況。然而在現實生活中單獨的一個標記無法準確的描述復雜的對象,一個對象可能與多個類別標記相關,標記之間也可能存在相關性。例如,在文本分類中,一篇題為“楊樹安談奧運籌備”的新聞報道可以被分類到“體育”、“交通”、“氣候”、“經濟”和“政治”的板塊中;在圖像分類中,一副圖像,可能與“沙灘”、“大海”、“椰子樹”等多個語義標記有關;此外,在音樂情感分析中,根據表達的情感的不同,一首歌可以同時具有“歡快”、“憂傷”、“鄉愁”等標記。擁有多個標記的對象在生活中隨處可見,因此近年來多標記分類引起了人們的廣泛研究和關注。
生物信息學是多標記學習應用較廣的領域。酵母啤酒細胞周期表達水平數據是一個常用的多標記學習數據,也是一個典型的生物信息學任務,其任務是預測這些酵母菌與14個功能目錄中的標記是否相關。在該類應用中,標記之間往往存在一定的層次結構并且已經被領域專家發現,比如樹狀結構的功能目錄以及有向無環圖結構的基因拓撲結構等,因此,在應用多標記學習技術時需要很好的利用這些標記之間的關系。
酵母菌功能預測存在一系列的挑戰:一方面每個酵母菌樣本可能的類別標記很多,并且這些標記之間具有一定的相關性,因此在多標記學習中需要考慮標記之間的相關性;另一方面,由于酵母菌數據都是有高維的基因序列描述的,因此酵母菌樣本具有數量大和向量維數高的兩大特點,決定了酵母菌特征選擇是一個運行時間和空間復雜度都很高的機器學習問題,這些數據過高的維度影響并制約著我們對數據的理解和建模。在現有技術中,已出現一些酵母菌數據的特征選擇方法。例如,一些以預報風險的嵌入式特征選擇方法為基礎,通過對每個特征進行評價,最終獲得最優特征子集。該方法與分類器和評價指標密切相關,很可能導致計算時間較長、降維效率低。
發明內容
本發明的目的在于提供一種基于粒子群優化的酵母菌多標記特征選擇方法及裝置,用以解決現有技術中的特征選擇方法的計算時間長、效率低的問題。
為解決上述技術問題,本發明的技術方案為:
本發明提供了一種基于粒子群優化的酵母菌多標記特征選擇方法,包括如下步驟:
提取酵母菌樣本數據集,所述酵母菌樣本數據集包括多個酵母菌樣本特征矩陣和樣本標記矩陣;
提取酵母菌樣本數據集的特征數據,初始化二進制編碼的粒子群;并初始化粒子群的位置和速度;
通過度量特征與特征之間的冗余性、特征與標記之間的相關性、標記和標記之間的相關性,構造結合標記相關性的CFS評價準則函數;
根據所述結合標記相關性的CFS評價函數,計算每個粒子的適應值;
對每個粒子,將其計算的適應值與其經歷過的最優位置pbest進行比較,若優于經歷過的最優位置pbest,則將所述計算的適應值作為其經歷過的最優位置pbest;
并將所有粒子的最優位置pbest作為群體的最優位置gbest;
更新粒子的位置和速度進行迭代,最終得到的群體的最優位置gbest中值為1所對應的特征,即為酵母菌數據集的最優特征子集。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于河南師范大學,未經河南師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810380973.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種多嵌入率含密圖像的隱寫檢測方法
- 下一篇:一種標注任務拆解方法及系統





