[發(fā)明專利]一種基于mtDNA遺傳信息聚類分析的區(qū)域人口結(jié)構(gòu)分析方法無(wú)效
| 申請(qǐng)?zhí)枺?/td> | 201210049757.0 | 申請(qǐng)日: | 2012-02-29 |
| 公開(kāi)(公告)號(hào): | CN102629255A | 公開(kāi)(公告)日: | 2012-08-08 |
| 發(fā)明(設(shè)計(jì))人: | 張虎勤;劉芳娥;吳曉明;杜建強(qiáng);夏娟娟;劉曉剛;郭燕 | 申請(qǐng)(專利權(quán))人: | 西安交通大學(xué) |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30;G06N3/12 |
| 代理公司: | 西安智大知識(shí)產(chǎn)權(quán)代理事務(wù)所 61215 | 代理人: | 弋才富 |
| 地址: | 710048*** | 國(guó)省代碼: | 陜西;61 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 mtdna 遺傳信息 聚類分析 區(qū)域 人口 結(jié)構(gòu) 分析 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及遺傳信息研究區(qū)域人口結(jié)構(gòu)的技術(shù)領(lǐng)域,特別涉及一種基于mtDNA遺傳信息聚類分析的區(qū)域人口結(jié)構(gòu)分析方法。
背景技術(shù)
人口結(jié)構(gòu)和組成與結(jié)構(gòu),通常是以民族、性別、年齡等因素為指標(biāo)進(jìn)行宏觀統(tǒng)計(jì)學(xué)分析和匯總,對(duì)人口結(jié)構(gòu)的認(rèn)識(shí)停留在直觀信息的統(tǒng)計(jì)分析上,存在工作量大,統(tǒng)計(jì)信息誤差大等缺點(diǎn)。嘗試從分子水平和基因序列信息表征區(qū)域人口的結(jié)構(gòu)和特征,使區(qū)域人口打上分子特征標(biāo)示,為區(qū)域人口成分界定和類群界定提供新的技術(shù)通道已經(jīng)成為研究的熱點(diǎn)。
發(fā)明內(nèi)容
為了克服上述現(xiàn)有技術(shù)的缺陷,本發(fā)明的目的在于提供一種基于mtDNA遺傳信息聚類分析的區(qū)域人口結(jié)構(gòu)分析方法,用遺傳算法和k-modes模型嵌合的聚類算法對(duì)區(qū)域人群mtDNA序列進(jìn)行聚類分析,實(shí)現(xiàn)對(duì)區(qū)域人口結(jié)構(gòu)進(jìn)行類群標(biāo)識(shí)和類群結(jié)構(gòu)劃分,以mtDNA多態(tài)性位點(diǎn)標(biāo)識(shí)人口類別聚類分析方法力求提高遺傳算法收斂速度搜索性能,達(dá)到高穩(wěn)定性的聚類分析結(jié)果。
為了實(shí)現(xiàn)上述任務(wù),本發(fā)明采取如下的技術(shù)解決方案:
一種基于mtDNA遺傳信息聚類分析的區(qū)域人口結(jié)構(gòu)分析方法,包括下列步驟:
步驟一、選擇樣本來(lái)源:根據(jù)數(shù)據(jù)庫(kù)資源信息量,選擇mtDNA高變I區(qū)長(zhǎng)度為350bp序列,選擇mtDNA高變I區(qū)在16026-16399區(qū)間序列,長(zhǎng)度為350bp,進(jìn)行聚類分析,依據(jù)數(shù)據(jù)庫(kù)提供的原始數(shù)據(jù),隨機(jī)選取所選區(qū)域內(nèi)的人口mtDNA數(shù)據(jù)在這個(gè)區(qū)間內(nèi)具有完整信息的樣本100-200個(gè);
步驟二、構(gòu)建遺傳算法的K-modes聚類嵌合的分析模型:
遺傳算法以個(gè)體適應(yīng)度的大小來(lái)確定該個(gè)體被遺傳到下一代群體中的概率,在遺傳K-modes算法中,采用聚類緊密度指標(biāo)作為個(gè)體的適應(yīng)度值,個(gè)體S的適應(yīng)度函數(shù)定義為:
其中Si為類Cj內(nèi)的元素,Zj為第j類的聚類中心,Dist表示距離度量,
所述的基于遺傳算法的K-modes模型算法執(zhí)行步驟為:
一、初始化種群,使每個(gè)個(gè)體表示一種分類方案,并對(duì)其進(jìn)行編碼;
二、從種群中選擇一個(gè)個(gè)體,對(duì)序列對(duì)象進(jìn)行編碼,對(duì)編碼后的序列對(duì)象進(jìn)行聚類;
三、通過(guò)公式(1)計(jì)算聚類結(jié)果的聚類內(nèi)緊密度值,并將該值作為個(gè)體的適應(yīng)度值返回;
四、有未被選擇的個(gè)體則返回到步驟(二);如果種群中所有個(gè)體都被選擇過(guò),通過(guò)循環(huán)語(yǔ)句判斷算法是否已完成規(guī)定的f(s)迭代次數(shù),若已完成規(guī)定的f(s)迭代次數(shù)則轉(zhuǎn)到步驟(六);否則進(jìn)入到步驟(五);
五、根據(jù)各個(gè)體的適應(yīng)度值和遺傳算法的參數(shù)采用精英保留策略,選擇出適應(yīng)度最高的個(gè)體,利用隨機(jī)概率選擇個(gè)體,通過(guò)交叉運(yùn)算和變異運(yùn)算的相互配合來(lái)優(yōu)化種群,并返回到步驟(二);
六、輸出最終結(jié)果,退出;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于西安交通大學(xué),未經(jīng)西安交通大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210049757.0/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 一種基于mtDNA遺傳信息聚類分析的區(qū)域人口結(jié)構(gòu)分析方法
- 一種優(yōu)秀冰雪運(yùn)動(dòng)員線粒體DNA分離與純化方法
- 基于表位抗原肽的抗mtDNA抗體酶聯(lián)免疫的檢測(cè)方法及其應(yīng)用
- LL-37-mtDNA復(fù)合物標(biāo)志物及其應(yīng)用
- 一種利用油菜CMS系根組織提取線粒體DNA的方法
- 基于集成學(xué)習(xí)的全球人類mtDNA發(fā)育樹分類查詢方法
- 一種提取黃瓜線粒體及其DNA的有效方法
- 檢測(cè)mtDNA突變的方法和系統(tǒng)
- 一種檢測(cè)小兒腦性癱瘓的試劑盒及其應(yīng)用
- 一種花生線粒體DNA的提取方法
- 一種用于聚類分析的教學(xué)裝置
- 基于聚類分析雙半掛汽車行駛穩(wěn)定性自動(dòng)識(shí)別與預(yù)警系統(tǒng)
- 一種判定服務(wù)器資源使用情況的方法和裝置
- 農(nóng)用地分等因素指標(biāo)區(qū)劃分方法及裝置
- 用于空中交通區(qū)域劃分的聚類分析方法
- 一種對(duì)視頻中人臉進(jìn)行聚類的分析識(shí)別方法
- 一種智慧課堂教學(xué)活動(dòng)推薦方法及系統(tǒng)
- 可視化展示方法、系統(tǒng)及可讀存儲(chǔ)介質(zhì)
- 聚類分析方法、聚類分析系統(tǒng)及可讀存儲(chǔ)介質(zhì)
- 客戶數(shù)據(jù)的聚類分析方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





