日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種保證質量單調性的大規模數據挖掘方法有效

專利信息
申請號: 201510080263.2 申請日: 2015-02-13
公開(公告)號: CN104657473B 公開(公告)日: 2019-01-25
發明(設計)人: 陳志;黨凱樂;岳文靜;黃繼鵬;芮路 申請(專利權)人: 南京郵電大學
主分類號: G06F16/2458 分類號: G06F16/2458
代理公司: 南京經緯專利商標代理有限公司 32200 代理人: 葉連生
地址: 210000 江蘇*** 國省代碼: 江蘇;32
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 保證質量 調性 大規模 數據 挖掘 方法
【說明書】:

發明給出一種保證質量單調性的數據挖掘方法,該方法將原始大數據集用PCA技術壓縮處理后映射到R?tree數據結構上;然后改進改進的K近鄰分類算法對數據集進行挖掘處理。本發明給出的方法主要包含兩部分:編碼部分及挖掘部分,其中編碼部分利用R?tree來表示數據,它將數據中有高相似性的數據組合在一起,作為R?tree的一個結點,以達到對海量數據壓縮的目的并提高挖掘部分的效率;挖掘部分利用改進的K近鄰分類算法的思想,對數據結點進行處理,預測輸入的測試點分類。本發明能解決傳統的算法在進行有限的時間及資源限制下對大數據挖掘時,很難做到挖掘結果的質量與資源限制的平衡以及保證近似結果質量單調性的問題。

技術領域

本發明涉及一種高效處理數據的方法,通過該方法來保證大規模數據挖掘結果質量的單調性,屬于數據挖掘、大數據和計算機軟件的交叉技術應用領域。

背景技術

大數據的數據容量及類型多樣性,使得我們愿意利用算法產生近似結果來對大數據進行數據挖掘,傳統的算法在進行有限的時間及資源限制下對大數據挖掘時,很難做到挖掘結果的質量與資源限制的平衡以及保證近似結果質量單調性的問題。為解決這個問題,我們在香農熵的基礎上,設計保證質量單調性的大數據挖掘方法,該挖掘方法分為兩部分:編碼部分及挖掘部分,通過保證算法編碼部分熵的單調性及挖掘部分的保熵性來確保挖掘算法輸出近似結果質量的單調性,原始數據集用PCA技術壓縮處理后映射到R-tree數據結構上的K近鄰分類的思想。該算法的編碼部分利用R-tree來表示數據,它將數據中有相似性的數據組合在一起,作為R-tree的一個結點,并盡量做到同節點內數據的高相似性,不同節點間的相對獨立性,以達到對海量數據壓縮的目的并提高挖掘部分的效率。挖掘部分利用K近鄰分類算法的思想,處理數據,建立數據分類模型,并對測試數據進行分類。

數據挖掘是數據庫知識發現(英語:Knowledge-Discovery in Databases,簡稱:KDD)中的一個步驟。數據挖掘一般是指從大量的數據中自動搜索隱藏于其中的有著特殊關系性的信息的過程。數據挖掘的一般步驟:(1)數據清理(2)數據集成(3)數據選擇(4)數據變換(5)數據挖掘(6)模式評估(7)知識表示。本發明使用的處理技術為主方法分析(PCA)技術。該技術方法通過減少數據的屬性來達到壓縮數據的目的,移除不重要的屬性。這種方法通過移除不重要的部分,保留重要部分來對海量數據壓縮,以便提高挖掘效率。

信息論中,熵表示的是不確定性的量度。信息熵可以理解成某種特定信息的出現概率(離散隨機事件的出現概率)。一個系統越是有序,信息熵就越低;反之,一個系統越是混亂,信息熵就越高。信息熵的函數說明:H=entropy(P,r)為信息熵函數P為信源的概率矢量,r為進制數,H為信息熵。本發明中將信息熵用于R樹上,且定義如下:設R-tree為T,同層節點對應一條編碼CodeA不同層節點生成編碼集,如果編碼集中任意兩條編碼A,B都滿足ifA<B,then A(x)<B(x),那么編碼集單調,即該編碼集滿足熵的單調性。

發明內容

技術問題:本發明的目的是解決在計算機資源和內存有限的條件下大規模數據挖掘輸出結果質量的低效問題,該方法能夠通過保證編碼階段熵的單調性和挖掘階段的保熵性來確保挖掘質量的單調性,提高數據挖掘的輸出質量。

技術方案:本發明所述的保證質量單調性的大數據挖掘方法包括編碼、挖掘等兩個部分,其中編碼部分利用主成分分析(PCA)壓縮技術對數據進行壓縮,減少數據的屬性;壓縮處理后的數據用R樹表示,挖掘部分利用K最近鄰(KNN)算法對測試數據進行分類,并計算分類準確率。

本發明所述的保證質量單調性的大數據挖掘方法包括以下步驟:

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京郵電大學,未經南京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201510080263.2/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖;

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 国产88av| 国产在线一区观看| 欧美一区二区三区免费播放视频了| 久久久人成影片免费观看| 精品国产乱码久久久久久老虎| 欧美久久精品一级c片| 国产综合亚洲精品| 亚洲少妇一区二区三区| 青苹果av| 精品国产一区二区在线| 久久国产精品-国产精品| 国产精品亚洲一区二区三区| 国产乱了高清露脸对白| 亚洲国产精品国自产拍久久| 日韩精品一区二区三区免费观看视频 | 日韩精品一区二区三区免费观看| 欧美精品免费一区二区| 在线观看国产91| 亚洲无人区码一码二码三码| 欧美一区二区三区免费观看视频| 欧美精品中文字幕在线观看| 国产日韩欧美中文字幕| 97精品久久久午夜一区二区三区| 午夜影院毛片| 国产精品久久久视频| 午夜影院激情| 中文av一区| 午夜国产一区二区| 欧美日韩国产精品综合| 91一区二区三区视频| 欧美乱战大交xxxxx| 精品国产一区二区三区高潮视| 日韩欧美国产精品一区| 91热精品| 久久国产欧美一区二区三区免费| 国产精品久久久不卡| 亚洲精品久久久久中文第一暮| 欧美一区二三区人人喊爽| 欧美日韩一区二区三区在线播放 | 久久精品com| 青苹果av| 欧美日韩综合一区二区| 国产精品九九九九九九| 欧美在线视频精品| 国产精品视频二区三区| 国产在线播放一区二区 | 久久国产免费视频| 91偷拍网站| 国产精品亚洲精品一区二区三区| 国产精品无码专区在线观看| 制服丝袜亚洲一区| 亚洲高清国产精品| 国产精品久久久av久久久| 国产精品久久久久久久久久久久久久久久久久 | 国产精品视频十区| 久久综合国产精品| 日韩精品免费一区二区三区| 欧美一级特黄乱妇高清视频| 99精品视频一区二区| 韩国女主播一区二区| 欧美日韩亚洲国产一区| 日韩av中文字幕第一页| 午夜电影一区| 精品99在线视频| 中文字幕一区三区| 亚洲制服丝袜在线| 国产欧美一区二区三区在线| 欧美黄色片一区二区| 91久久香蕉国产日韩欧美9色| 久久影视一区二区| 国产精品二十区| 老太脱裤子让老头玩xxxxx| 国产一区二区三区乱码| 亚洲精品乱码久久久久久按摩| 久久国产免费视频| 99精品区| 强行挺进女警紧窄湿润| 久久99精品久久久野外直播内容| 色妞妞www精品视频| 久久第一区| 色妞妞www精品视频| 国产精品久久久久久久久久软件|