[發明專利]玉米良種選育方法有效
| 申請號: | 201210521228.6 | 申請日: | 2012-12-07 |
| 公開(公告)號: | CN103020864A | 公開(公告)日: | 2013-04-03 |
| 發明(設計)人: | 邱建林;顧翔;陳建平;季丹;陳燕云;卞彩峰 | 申請(專利權)人: | 南通大學 |
| 主分類號: | G06Q50/02 | 分類號: | G06Q50/02 |
| 代理公司: | 南通市永通專利事務所 32100 | 代理人: | 葛雷 |
| 地址: | 226019*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 玉米 良種 選育 方法 | ||
技術領域
本發明涉及一種玉米良種選育方法。?
背景技術
原始的數據難以直接地應用到數據挖掘的處理過程中,需在分析之前將數據進行某種變換,以轉換成對算法有用的特征,這個步驟就叫做原始數據集的準備和變換。它廣泛地應用于數據挖掘的各個環節中,是較為重要的一步。傳統的處理手段有很多,有簡單的變換操作,例如變量的標準化、離散化等;有基于降維的特征提取、選擇和構造方法,例如主成分分析法(PCA)、非線性區別分析、Kohonen匹配、Sammon投影等;有結合其他領域知識的處理方法,例如分形技術、聚類和支持向量機等。可見數據的預處理步驟方法眾多,適用范圍廣泛。?
聚類是一種常見的數據挖掘分析工具,它基于“物以類聚”的思想,把大量數據點的集合分成若干類或簇,使得每個類中的數據之間最大程度地相似,而不同類中的數據最大程度地不同。聚類分析屬于一種無指導的學習方法,它的一個突出特點是能處理大型復雜的數據集,而且可作為其他算法的預處理步驟。?
傳統的聚類方法可分為四個方面:基于劃分、層次、密度和網格的聚類方式。常見的經典算法包括K-MEANS劃分算法;CURE[1]、BIRCH、CHAMELEON[2]層次算法;DBSCAN密度算法;STING、WaveCluster、CLIQUE?網格算法等。其中,K-MEANS算法簡單易懂,不需要繁復的先驗條件,且對于小規模數據的聚類效果較好;CURE算法采用了固定數目個樣本點代表簇類,可捕捉任意形狀的樣本集;BIRCH算法對于統一大小的凸面和球狀數據集較為有效,但對部分參數敏感;DBSCAN算法靈活,無需知道聚類數目,對于噪聲和高維數據的處理效果較好,只是對密度參數等較為敏感;STING算法多用于其它算法的并行處理步驟,可提高算法的處理效率…?
由此可見,傳統的聚類算法在伸縮性能、數據類型的處理、參數的敏感、發現的簇類形狀等方面都或多或少地存在一些缺陷,而且在處理日趨增長的高維數據方面也遇到了一定的瓶頸。因此,改進傳統的聚類算法,注入新鮮的領域知識,形成現代的聚類方法,對于我們處理大規模的高維數據是必不可少的。例如,基于模型的COBWEB統計模型、神經網絡模型以及超圖模型、基于譜圖的譜聚類方法、針對流數據的聚類方法以及結合其他領域知識所得的聚類方法(基于遺傳算法的蟻群算法和人工魚群算法、基于模糊理論的模糊聚類算法等)。每種聚類算法都有自己的優缺點和適用環境,所以我們在選擇聚類算法時,需針對具體的目標要求和自身特點,選擇最適合的聚類算法,以便我們能挖掘出潛在的有用規律。?
決策樹算法作為分類方法的一個分支,是應用較為廣泛的邏輯方法之一,其最大優點就是在學習過程中不需要太多背景知識,只需通過分類信息即可訓樣本,并用屬性-結論的形式表示出來。這種類似于流程圖的表述,能直觀地反映出數據的特征關系。對于不需太多專?家知識的數據集來說,運用決策樹算法對數據集進行分析,效果較好。目前較為著名的有ID3、C4.5、CART、SLIQ、SPRINT、CHAID等。但這些算法或多或少都存在一些問題,比如采用信息增益的方式會導致屬性偏向的問題;屬性劃分時最優閾值的確定;建樹過程不能回溯,只能尋找局部最優結果;不同的剪枝策略會導致不同的決策樹等。?
發明內容
本發明的目的在于提供一種簡便、效果好的玉米良種選育方法。?
本發明的技術解決方案是:?
一種玉米良種選育方法,其特征是:包括下列步驟:?
(1)選取樣本集?
選取原始玉米樣本集中的多個子類玉米、多個重要屬性作為分析對象,以應用融合的數據挖掘算法;?
(2)橫向降維?
1)標準化所選樣本集;?
2)計算所選擇的多個屬性的相關系數矩陣,分析相關系數矩陣,并標記關聯屬性集M1;?
3)通過計算系數因子,可得到主成分的前幾列系數矩陣,并標記關聯屬性集M2;?
4)合并關聯屬性集M1、M2中相關的集合,得到幾組相關性較強的屬性組,且每一組屬性組中的屬性也分別高關聯;?
5)根據所得的關聯屬性組,選擇相應的主成分式子,并根據屬性在主成分式子中的系數因子,確定該屬性在相應成分中所占的比重,作?為權重,可得新的特征值集合,用于后續算法的處理;?
(3)縱向約簡?
1)異常點檢測;檢測新的特征集中超過[-1.5,1.5]范圍的特殊樣本點,并進行異常分析;?
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南通大學,未經南通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210521228.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種帶壓力傳感器的實時監控盤形制動器
- 下一篇:草坪專用緩控釋肥及其生產工藝





