[發明專利]一種基于mtDNA遺傳信息聚類分析的區域人口結構分析方法無效
| 申請號: | 201210049757.0 | 申請日: | 2012-02-29 |
| 公開(公告)號: | CN102629255A | 公開(公告)日: | 2012-08-08 |
| 發明(設計)人: | 張虎勤;劉芳娥;吳曉明;杜建強;夏娟娟;劉曉剛;郭燕 | 申請(專利權)人: | 西安交通大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06N3/12 |
| 代理公司: | 西安智大知識產權代理事務所 61215 | 代理人: | 弋才富 |
| 地址: | 710048*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 mtdna 遺傳信息 聚類分析 區域 人口 結構 分析 方法 | ||
1.一種基于mtDNA遺傳信息聚類分析的區域人口結構分析方法,其特征在于,包括下列步驟:
步驟一、選擇樣本來源:根據數據庫資源信息量,選擇mtDNA高變I區長度為350bp序列,選擇mtDNA高變I區在16026-16399區間序列,長度為350bp,進行聚類分析,依據數據庫提供的原始數據,隨機選取所選區域內的人口mtDNA數據在這個區間內具有完整信息的樣本100-200個;
步驟二、構建遺傳算法的K-modes聚類嵌合的分析模型:
遺傳算法以個體適應度的大小來確定該個體被遺傳到下一代群體中的概率,在遺傳K-modes算法中,采用聚類緊密度指標作為個體的適應度值,個體S的適應度函數定義為:
其中Si為類Cj內的元素,Zj為第j類的聚類中心,Dist表示距離度量,
步驟三、適應度函數f(s)分析:采用VC++6.0實現遺傳算法的K-modes嵌合模式的程序設計,對所選擇區域人類的mtDNA聚類分析,通過50-120次迭代使f(s)趨于穩定值,根據各區域通過不同的迭代次數使得適應度函數f(s)趨于穩定值,可以判定各區域人群的mtDNA差異度,使適應度函數f(s)趨于穩定值的迭代次數越多,對應的適應度函數f(s)穩定值越小,表明該區域人群的mtDNA差異度越高;
步驟四、聚類分析:依據遺傳算法的K-modes嵌合模型算法,對每個區域內所選的人群mtDNA樣本進行聚類分析,得到類群分布規律及各聚類中心之間的距離;
步驟五、區域人口結構分析:根據聚類分析結果,通過統計在各個類群的樣本數占選擇的總樣本數的百分比從而推算出各個類群中的人口分布密度,從而對各區域的人口結構作出分析。
2.根據權利要求1所述的方法,其特征在于,所述的基于遺傳算法的K-modes模型算法執行步驟為:
一、初始化種群,使每個個體表示一種分類方案,并對其進行編碼;
二、從種群中選擇一個個體,對序列對象進行編碼,對編碼后的序列對象進行聚類;
三、通過公式(1)計算聚類結果的聚類內緊密度值,并將該值作為個體的適應度值返回;
四、有未被選擇的個體則返回到步驟(二);如果種群中所有個體都被選擇過,通過循環語句判斷算法是否已完成規定的f(s)迭代次數,若已完成規定的f(s)迭代次數則轉到步驟(六);否則進入到步驟(五);
五、根據各個體的適應度值和遺傳算法的參數采用精英保留策略,選擇出適應度最高的個體,利用隨機概率選擇個體,通過交叉運算和變異運算的相互配合來優化種群,并返回到步驟(二);
六、輸出最終結果,退出。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安交通大學,未經西安交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210049757.0/1.html,轉載請聲明來源鉆瓜專利網。





