[發明專利]一種考慮基因相關度的基因選擇方法與裝置有效
| 申請號: | 201910453065.4 | 申請日: | 2019-05-28 |
| 公開(公告)號: | CN110211638B | 公開(公告)日: | 2023-03-24 |
| 發明(設計)人: | 孫林;寧遠翔;曹玉潔;李晨陽;王藍瑩;秦小營;趙婧;殷騰宇;王天翔;黃金旭 | 申請(專利權)人: | 河南師范大學 |
| 主分類號: | G16B30/10 | 分類號: | G16B30/10;G16B30/20 |
| 代理公司: | 鄭州睿信知識產權代理有限公司 41119 | 代理人: | 吳敏 |
| 地址: | 453007 *** | 國省代碼: | 河南;41 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 考慮 基因 相關 選擇 方法 裝置 | ||
1.一種考慮基因相關度的基因選擇方法,其特征在于,包括以下步驟:
選取至少兩個待比較的鄰域半徑;利用鄰域粗糙集模型在各鄰域半徑下對初始基因集合進行約簡,得到各鄰域半徑對應的基因子集,作為候選基因子集;
計算各基因子集的基因個數,利用對數據集進行分類后得到分類精度,以及通過基因子集中各基因之間的相關系數求出相應基因子集的平均相關系數;
根據各基因子集的基因個數、分類精度和平均相關系數,計算各鄰域半徑的適應度函數,其計算公式如下:
fit(δ)=α·length+β·ratio+ω·relate
其中,α、β和ω是權重因子,length、ratio和relate表示在相應鄰域半徑下的基因子集的基因個數、分類精度和平均相關系數;
比較計算得到的各鄰域半徑的適應度大小,選擇適應度最大的鄰域半徑作為最優的鄰域半徑,所述適應度最大的鄰域半徑對應的基因子集作為選擇的基因子集。
2.根據權利要求1所述的一種考慮基因相關度的基因選擇方法,其特征在于,所述平均相關系數的計算公式如下:
其中,n表示所述約簡得到各鄰域半徑對應的基因子集中的基因個數,rij表示基因子集中基因ai和aj之間的相關系數。
3.根據權利要求1所述的一種考慮基因相關度的基因選擇方法,其特征在于,利用鄰域粗糙集模型在各鄰域半徑下對初始基因集合進行約簡的過程中,采用的依賴度為基于容錯的依賴度,計算公式如下:
其中,POS′B(D)表示基因數據的所屬類別D關于集合B的具有容錯性能的正域,Card(POS′B(D))表示POS′B(D)中的樣本個數,Card(U)表示基因數據集U中的樣本個數。
4.根據權利要求3所述的一種考慮基因相關度的基因選擇方法,其特征在于,利用鄰域粗糙集模型在各鄰域半徑下對初始基因集合進行約簡包括:
(1)根據鄰域粒度度量分析算法計算鄰域知識粒度,根據所述基于容錯的依賴度與所述鄰域知識粒度的比,計算得到基于容錯的鄰域粗糙集的依賴度和知識粒度混合度量啟發式函數;
(2)計算初始基因集合中每個基因的重要度SIG′(a,D,B),公式如下:
SIG'δ(a,D,B)=H'δ(B∪a)-H'δ(B)
其中,a∈C-B,SIG′(a,D,B)表示初始基因集合中每個基因的重要度,H′δ(B∪a)為基于容錯的鄰域粗糙集在集合B∪a上的依賴度和知識粒度混合度量啟發式函數,H′δ(B)為基于容錯的鄰域粗糙集在集合B上的依賴度和知識粒度混合度量啟發式函數;
(3)選擇重要度大于設定值的基因構成候選基因子集。
5.根據權利要求1所述的一種考慮基因相關度的基因選擇方法,其特征在于,利用鄰域粗糙集模型在所述適應度最大的鄰域半徑下對初始基因集合進行再次約簡,得到最終選擇的基因子集;在再次約簡的過程中,采用的依賴度為基于容錯的依賴度,計算公式如下:
其中,POS′B(D)表示基因數據的所屬類別D關于集合B的具有容錯性能的正域,Card(POS′B(D))表示POS′B(D)中的樣本個數,Card(U)表示基因數據集U中的樣本個數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于河南師范大學,未經河南師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910453065.4/1.html,轉載請聲明來源鉆瓜專利網。





