[發明專利]分析新增企業與區域經濟活躍度關聯性的數據挖掘方法在審
| 申請號: | 201710426592.7 | 申請日: | 2017-06-08 |
| 公開(公告)號: | CN107085621A | 公開(公告)日: | 2017-08-22 |
| 發明(設計)人: | 胡夏禹;施陽;劉培彬;陳建明;殷姚吉 | 申請(專利權)人: | 蘇州朗動網絡科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06Q10/06 |
| 代理公司: | 江蘇圣典律師事務所32237 | 代理人: | 王玉國 |
| 地址: | 215021 江蘇省蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 分析 新增 企業 區域經濟 活躍 關聯性 數據 挖掘 方法 | ||
1.分析新增企業與區域經濟活躍度關聯性的數據挖掘方法,其特征在于包含以下步驟:
(一)數據收集,采集某年地區注冊企業的注冊資金數據、注冊企業的數量數據、以及該地區該年份的GDP數據和新增就業情況數據,每一個地區作為一個數據對象;
(二)數據預處理,對數據進行預處理,使數據為平滑數據;
(三)采用K-means算法進行聚類分析;
(四)根據聚類將數據集分為k個類,按照所給企業數據對各個地方的經濟進行預測最終結果。
2.根據權利要求1所述的分析新增企業與區域經濟活躍度關聯性的數據挖掘方法,其特征在于:步驟(三)包括以下步驟:
1)確定聚類的分組組數k的值和結束條件;
2)確定初始化聚類的中心,從數據中選取k個數據對象作為k個組的初始聚類中心;
3)進行初始分組,計算數據集中的每個數據對象到k個聚類中心點的距離,將該數據對象分到距離最小的類中;
4)更新聚類中心,將每個類中所有數據對象的平均值作為該類新的聚類中心;
5)檢查是否滿足結束條件,若滿足則完成聚類,否則重復步驟3)~5),直至達到結束條件為止。
3.根據權利要求2所述的分析新增企業與區域經濟活躍度關聯性的數據挖掘方法,其特征在于:步驟1)中,結束條件為迭代次數達到一個設定的值,或者誤差小于給定的閾值。
4.根據權利要求3所述的分析新增企業與區域經濟活躍度關聯性的數據挖掘方法,其特征在于:迭代次數達到1000次,或者聚類的中心不再改變。
5.根據權利要求2所述的分析新增企業與區域經濟活躍度關聯性的數據挖掘方法,其特征在于:步驟2)中,在確定初始聚類中心時,選取區別較大的數據對象。
6.根據權利要求2所述的分析新增企業與區域經濟活躍度關聯性的數據挖掘方法,其特征在于:步驟3)中,所述距離為歐幾里得距離,歐幾里得距離為:
其中,Rin是第i個數據對象的第n維數據,Rjn是第j個聚類中心的第n維數據,其中(j∈[1,k.])n代表一個數據對象當前所在維度,m是數據對象的維數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州朗動網絡科技有限公司,未經蘇州朗動網絡科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710426592.7/1.html,轉載請聲明來源鉆瓜專利網。





