[發明專利]云計算環境下的分類規則挖掘方法有效
| 申請號: | 201210203816.5 | 申請日: | 2012-06-19 |
| 公開(公告)號: | CN102737126A | 公開(公告)日: | 2012-10-17 |
| 發明(設計)人: | 楊善林;丁靜;羅賀;丁帥;徐達宇;范雯娟 | 申請(專利權)人: | 合肥工業大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06N3/12;H04L29/08 |
| 代理公司: | 安徽省合肥新安專利代理有限責任公司 34101 | 代理人: | 何梅生 |
| 地址: | 230009 *** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 計算 環境 分類 規則 挖掘 方法 | ||
1.一種云計算環境下的分類規則挖掘方法,其特征在于:
所述云計算環境由多個分布式的服務器構成;在所述云計算環境下實施分類規則挖掘時,采取主從式組織結構,所述主從式組織結構為設置一臺服務器為控制中心,其它服務器為從屬服務器;由所述控制中心安排部署整個挖掘任務的執行、調度管理并協調各從屬服務器的操作;所述各從屬服務器是任務的具體執行單元,所述分類規則挖掘方法按如下步驟進行:
a、由控制中心將待分類的數據集劃分為訓練樣本和測試樣本,對所述訓練樣本進行均勻劃分,得到相同大小的各數據塊,為每個數據塊指定一個執行分類挖掘任務的從屬服務器作為處理單元,將所述各數據塊分配到對應的各處理單元上;
b、由所述處理單元采用遺傳算法對分配得到的數據塊實施用于分類的原子規則的訓練,將訓練得到的原子規則存入緩沖區;
c、由所述控制中心對緩沖區內的原子規則進行劃分,選擇閑置的從屬服務器作為分類器,安排分類器進行原子規則的冗余約簡,并檢測約簡結果的分類精度,篩選出滿足分類精度要求的約簡結果,作為分類規則挖掘的最終結果。
2.根據權利要求書1所述的云計算環境下的分類規則挖掘方法,其特征在于,所述步驟a的執行過程是:
控制中心在接到分類挖掘任務的請求后,將待分類的數據集劃分為訓練樣本和測試樣本,根據用戶所提出分類挖掘任務的要求以及訓練樣本的特征,搜索合適的從屬服務器作為處理單元,并將訓練樣本均勻劃分成大小相同的數據塊;設滿足條件的處理單元數量為N,訓練樣本大小為M,則所劃分的數據塊大小為M/N;
所述合適的從屬服務器滿足的條件是:存儲空間不小于M/N,響應時間不大于用戶所要求的最晚時間;
控制中心訪問所述訓練樣本,將劃分所得的數據塊復制到相應的處理單元上,并向處理單元傳遞利用遺傳算法訓練原子規則的操作指令。
3.根據權利要求書1所述的云計算環境下的分類規則挖掘方法,其特征在于,所述步驟b中的原子規則的訓練過程是:
處理單元對構成數據塊的每一條數據記錄進行遺傳編碼,通過遺傳操作的循環迭代生成原子規則,將所述原子規則以<key,value>鍵值對的形式存入緩沖區,所述<key,value>鍵值對中的key為類標簽,value為該類標簽下的原子規則;
控制中心周期性地讀取緩沖區中的<key,value>鍵值對,生成<key,value?list>鍵值對列表存入緩沖區,所述<key,value?list>鍵值對列表中的key為類標簽,value?list為該類標簽下的原子規則列表;
處理單元完成對數據塊中所有數據記錄的操作之后,向控制中心發送處理單元操作完畢的消息。
4.根據權利要求書1所述的云計算環境下的分類規則挖掘方法,其特征在于,所述步驟c按如下過程進行:
由控制中心搜索閑置的從屬服務器作為分類器,分類器的個數為<key,value?list>鍵值對列表中key值的個數,每個分類器對應一個key值;控制中心將<key,value?list>鍵值對列表中的原子規則列表和測試樣本中具有相同類標簽的記錄傳送到的分類器中,并向分類器傳遞冗余約簡和分類精度檢測的操作指令;
分類器對同一類標簽下的多個相同原子規則只記錄一次,刪除冗余的原子規則,得到約簡后的原子規則;
分類器利用約簡后的原子規則對測試樣本進行分類,檢測分類結果是否與測試樣本的類標簽相一致,假設被原子規則a分類的測試樣本中,有Y條記錄的類標簽與分類結果相一致,有N條記錄的類標簽與分類結果不一致,則原子規則a的分類精度為Y/(Y+N);假定用戶提出的分類挖掘任務要求中,分類精度要求為α,將所有分類精度不小于α的原子規則作為分類規則挖掘的最終結果傳送給控制中心;
控制中心匯總所有分類器生成的最終結果,再將匯總結果反饋至分類規則挖掘任務的請求者。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于合肥工業大學,未經合肥工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210203816.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:軸承
- 下一篇:實現兩乘員移動戰斗平臺運轉的火炮觀瞄方法





