[發明專利]分析新增企業與區域經濟活躍度關聯性的數據挖掘方法在審
| 申請號: | 201710426592.7 | 申請日: | 2017-06-08 |
| 公開(公告)號: | CN107085621A | 公開(公告)日: | 2017-08-22 |
| 發明(設計)人: | 胡夏禹;施陽;劉培彬;陳建明;殷姚吉 | 申請(專利權)人: | 蘇州朗動網絡科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06Q10/06 |
| 代理公司: | 江蘇圣典律師事務所32237 | 代理人: | 王玉國 |
| 地址: | 215021 江蘇省蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 分析 新增 企業 區域經濟 活躍 關聯性 數據 挖掘 方法 | ||
技術領域
本發明涉及一種用于分析新增企業與區域經濟活躍度關聯性的數據挖掘方法。
背景技術
近些年來,隨著國家經濟飛速發展,以及政府大力支持自主創業,新增的企業也越來越多。但是新增的企業在地區上也存在很大的差異性,如北上廣深,這些經濟發達的地區,每年新增的企業無論是數量還是規模上都遠遠超過其他地區。
如何從新注冊的企業入手,通過分析各個地區注冊企業的信息,分析地區新增企業的數量、規模與該地區經濟活躍度之間存在的關系。
發明內容
本發明的目的是克服現有技術存在的不足,提供一種用于分析新增企業與區域經濟活躍度關聯性的數據挖掘方法。
本發明的目的通過以下技術方案來實現:
分析新增企業與區域經濟活躍度關聯性的數據挖掘方法,特點是包含以下步驟:
(一)數據收集,采集某年地區注冊企業的注冊資金數據、注冊企業的數量數據、以及該地區該年份的GDP數據和新增就業情況數據,每一個地區作為一個數據對象;
(二)數據預處理,對數據進行預處理,使數據為平滑數據;
(三)采用K-means算法進行聚類分析;
(四)根據聚類將數據集分為k個類,按照所給企業數據對各個地方的經濟進行預測最終結果。
進一步地,上述的分析新增企業與區域經濟活躍度關聯性的數據挖掘方法,其中,步驟(三)包括以下步驟:
1)確定聚類的分組組數k的值和結束條件;
2)確定初始化聚類的中心,從數據中選取k個數據對象作為k個組的初始聚類中心;
3)進行初始分組,計算數據集中的每個數據對象到k個聚類中心點的距離,將該數據對象分到距離最小的類中;
4)更新聚類中心,將每個類中所有數據對象的平均值作為該類新的聚類中心;
5)檢查是否滿足結束條件,若滿足則完成聚類,否則重復步驟3)~5),直至達到結束條件為止。
更進一步地,上述的分析新增企業與區域經濟活躍度關聯性的數據挖掘方法,其中,步驟1)中,結束條件為迭代次數達到一個設定的值,或者誤差小于給定的閾值。
更進一步地,上述的分析新增企業與區域經濟活躍度關聯性的數據挖掘方法,其中,迭代次數達到1000次,或者聚類的中心不再改變。
更進一步地,上述的分析新增企業與區域經濟活躍度關聯性的數據挖掘方法,其中,步驟2)中,在確定初始聚類中心時,選取區別較大的數據對象。
更進一步地,上述的分析新增企業與區域經濟活躍度關聯性的數據挖掘方法,其中,步驟3)中,所述距離為歐幾里得距離,
歐幾里得距離為:
其中,Rin是第i個數據對象的第n維數據,Rjn是第j個聚類中心的第n維數據,其中(j∈[1,k.])n代表一個數據對象當前所在維度,m是數據對象的維數。
更進一步地,上述的分析新增企業與區域經濟活躍度關聯性的數據挖掘方法,其中,步驟(一)中,數據對象組成的數據集表示為P={R1,R2,…,Rm},其中R1,R2,…,Rm為m個數據對象,其中每個數據對象都有n個維度,m個數據對象組成的矩陣為:
更進一步地,上述的分析新增企業與區域經濟活躍度關聯性的數據挖掘方法,其中,步驟(二)中,用分箱法對數據進行預處理,去掉臟數據,確保數據平滑。
再進一步地,上述的分析新增企業與區域經濟活躍度關聯性的數據挖掘方法,其中,將數據按照企業類型分組,每一組都按照企業注冊資金進行排序,將每組中最大的和最小的1%的數據刪除。
再進一步地,上述的分析新增企業與區域經濟活躍度關聯性的數據挖掘方法,其中,將數據按照企業的注冊資金進行分組,每一組按照企業規模進行排序,將每組中最大的和最小的1%的數據刪除。
本發明與現有技術相比具有顯著的優點和有益效果,具體體現在以下方面:
①通過指定k個初始聚類中心而不是隨機選取,消除了隨機選取初始聚類中心導致分組的不確定性,有更好的分組效果;
②通過給予不同的數據維度一定的權重值,而不是一視同仁,改進了現有技術中進行分組時不同數據維度相同權重的缺點,更好體現各維度對分組的影響,使分組更加準確;
③加快了算法的收斂程度,能夠更快地得到分組結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州朗動網絡科技有限公司,未經蘇州朗動網絡科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710426592.7/2.html,轉載請聲明來源鉆瓜專利網。





