[發(fā)明專利]一種基于啟發(fā)式寬度優(yōu)先搜索腫瘤相關(guān)基因的方法無效
| 申請?zhí)枺?/td> | 201310019941.5 | 申請日: | 2013-01-18 |
| 公開(公告)號: | CN103186717A | 公開(公告)日: | 2013-07-03 |
| 發(fā)明(設(shè)計(jì))人: | 黃上峰;王樹林;李雪玲;趙俊;邱萍;王耀雄;葛運(yùn)建;雙豐;朱旻 | 申請(專利權(quán))人: | 中國科學(xué)院合肥物質(zhì)科學(xué)研究院 |
| 主分類號: | G06F19/24 | 分類號: | G06F19/24 |
| 代理公司: | 合肥天明專利事務(wù)所 34115 | 代理人: | 奚華保 |
| 地址: | 230031 安*** | 國省代碼: | 安徽;34 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 啟發(fā)式 寬度 優(yōu)先 搜索 腫瘤 相關(guān) 基因 方法 | ||
1.一種基于啟發(fā)式寬度優(yōu)先搜索腫瘤基因的方法,其特征在于:采用在選出的基因子集中的出現(xiàn)頻數(shù)來度量基因,排在前面的基因被認(rèn)為是最重要的腫瘤相關(guān)基因,并由此設(shè)計(jì)分類器,及建立基于HBSA算法的基因排序方法,其步驟如下:?
(1)、設(shè)G={g1,…,gn}表示一組基因,集合S={s1,…,sm}表示一組樣本;其中|G|=n表示基因的數(shù)量,|S|=m表示樣本的數(shù)量;相應(yīng)的基因表達(dá)譜數(shù)據(jù)集表示為矩陣X=(xi,j)mn,1≤i≤m,1≤j≤n,其中xi,j表示基因gj在樣本si的表達(dá)量,通常n>>m;?
在基因表達(dá)矩陣中每一個向量si都被看作n-維空間中的一個點(diǎn)。并且m個樣本向量中每一個都由n個元素的表達(dá)向量組成;假設(shè)L={c1,…,ck}表示數(shù)據(jù)集中標(biāo)簽集合,|L|=k表示數(shù)據(jù)集中類別的數(shù)量;通常,每個樣本的類別識已知的,因此,S×L={(si,li)|si∈Rn,li∈Rn,li∈L,i=1,2,…,m}表示帶有類別標(biāo)簽的樣本空間;?
(2)、從基因空間P(G)即基因集合G的冪集中選擇具有最高分類性能的信息基因子集T;假設(shè)具有強(qiáng)分類性能的基因子集與特定的腫瘤亞型相關(guān),記號Acc(T)表示基因子集T對樣本數(shù)據(jù)集的分類能?力,通常采用分類器的預(yù)測精度來度量T分類性能,選出得信息基因子集T要滿足下面兩個目標(biāo):?
minT∈P(G)(|T|)????(1)?
maxT∈P(G)(Acc(T))????(2)?
其中|T|表示基因子集T的基數(shù),滿足目標(biāo)(1)和(2)的基因子集被稱為最佳基因子集T*;最佳子集A*包含了所有的最佳基因子集T*,也就是說,T*同時滿足目標(biāo)(1)和(2)}。
2.根據(jù)權(quán)利要求1所述的基于啟發(fā)式寬度優(yōu)先搜索腫瘤基因的方法,其特征在于:?
所述分類器在設(shè)計(jì)時,每個類別中訓(xùn)練樣本的數(shù)量至少是特征數(shù)量的5倍以上,也就是:?
(m/k)/sn>5????(4)?
其中k表示類別的數(shù)量,m表示訓(xùn)練樣本的數(shù)量,sn表示選出的基因的數(shù)量;由N個個體分類器構(gòu)成的集成分類器對每一樣本的分類可靠性,每一樣本定義了一個置信度,假設(shè)一個數(shù)據(jù)集有k個?子類,表示為L={c1,…,ck},一個測試樣本被賦予一個表決向量(m1,…,mk),其中每一個分量mi表示表決該樣本對應(yīng)于L={c1,…,ck}中的子類ci所獲得的表決票數(shù),其中,記mmaxandmsec分別表示表決向量(m1,…,mk)中獲得的最大和次最大表決票,一個測試樣本的置信度conf定義為:conf=mmax/msec。如果msec=0,conf被設(shè)置為N,其中1≤conf≤N。置信度conf越大。?
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國科學(xué)院合肥物質(zhì)科學(xué)研究院,未經(jīng)中國科學(xué)院合肥物質(zhì)科學(xué)研究院許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310019941.5/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F19-00 專門適用于特定應(yīng)用的數(shù)字計(jì)算或數(shù)據(jù)處理的設(shè)備或方法
G06F19-10 .生物信息學(xué),即計(jì)算分子生物學(xué)中的遺傳或蛋白質(zhì)相關(guān)的數(shù)據(jù)處理方法或系統(tǒng)
G06F19-12 ..用于系統(tǒng)生物學(xué)的建模或仿真,例如:概率模型或動態(tài)模型,遺傳基因管理網(wǎng)絡(luò),蛋白質(zhì)交互作用網(wǎng)絡(luò)或新陳代謝作用網(wǎng)絡(luò)
G06F19-14 ..用于發(fā)展或進(jìn)化的,例如:進(jìn)化的保存區(qū)域決定或進(jìn)化樹結(jié)構(gòu)
G06F19-16 ..用于分子結(jié)構(gòu)的,例如:結(jié)構(gòu)排序,結(jié)構(gòu)或功能關(guān)系,蛋白質(zhì)折疊,結(jié)構(gòu)域拓?fù)洌媒Y(jié)構(gòu)數(shù)據(jù)的藥靶,涉及二維或三維結(jié)構(gòu)的
G06F19-18 ..用于功能性基因組學(xué)或蛋白質(zhì)組學(xué)的,例如:基因型–表型關(guān)聯(lián),不均衡連接,種群遺傳學(xué),結(jié)合位置鑒定,變異發(fā)生,基因型或染色體組的注釋,蛋白質(zhì)相互作用或蛋白質(zhì)核酸的相互作用
- MPEG-4視頻并行編碼中的形狀自適應(yīng)的啟發(fā)式數(shù)據(jù)劃分方法
- 自動化的客戶端設(shè)備管理
- 一種用于船舶航線設(shè)計(jì)的啟發(fā)式航段尋徑方法
- 基于圖的超啟發(fā)式的蜂窩網(wǎng)絡(luò)頻譜分配方法
- 一種基于超啟發(fā)式算法的零空閑流水車間作業(yè)調(diào)度方法
- 一種CiscoIOS啟發(fā)式模糊測試技術(shù)
- 一種基于超啟發(fā)式算法的衛(wèi)星任務(wù)規(guī)劃方法
- 基于MAB的超啟發(fā)式算法求解多目標(biāo)優(yōu)化問題的方法
- 基于物場分析與規(guī)則推理的產(chǎn)品創(chuàng)新設(shè)計(jì)方法及系統(tǒng)
- 基于啟發(fā)式深度強(qiáng)化學(xué)習(xí)的路徑規(guī)劃方法





