[發(fā)明專利]一種基于標簽化的數(shù)據分析方法在審
| 申請?zhí)枺?/td> | 201911344104.3 | 申請日: | 2019-12-24 |
| 公開(公告)號: | CN111191125A | 公開(公告)日: | 2020-05-22 |
| 發(fā)明(設計)人: | 洪章陽;陳征宇;何凱;黃炳裕;黃河;戴文艷 | 申請(專利權)人: | 長威信息科技發(fā)展股份有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06Q30/02 |
| 代理公司: | 福州市鼓樓區(qū)京華專利事務所(普通合伙) 35212 | 代理人: | 宋連梅 |
| 地址: | 350000 福建省福州市保稅*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 標簽 數(shù)據 分析 方法 | ||
本發(fā)明提供了數(shù)據挖掘分析領域的一種基于標簽化的數(shù)據分析方法,包括如下步驟:步驟S10、從數(shù)據庫獲取各實體的原始數(shù)據;步驟S20、定義一標簽體系、一計算規(guī)則以及一邏輯規(guī)則;步驟S30、基于所述標簽體系、計算規(guī)則以及邏輯規(guī)則對各條原始數(shù)據進行打標簽,生成標簽數(shù)據;步驟S40、對所述標簽數(shù)據進行分群;步驟S50、對分群的所述標簽數(shù)據或者單個實體的標簽數(shù)據進行自助多維分析與展示。本發(fā)明的優(yōu)點在于:極大的提升了數(shù)據分析的應用范圍,適用于各行業(yè),并能對數(shù)據進行自助多維分析,進而顯著的提升了數(shù)據的應用價值。
技術領域
本發(fā)明涉及數(shù)據挖掘分析領域,特別指一種基于標簽化的數(shù)據分析方法。
背景技術
在新型智慧城市和智慧政務領域,面臨著需要集中數(shù)據資源以便支撐新型智慧城市或者智慧政務的智慧化應用的挑戰(zhàn),大數(shù)據是其中重要的戰(zhàn)略資源,數(shù)據驅動成為新型智慧城市和智慧政務的核心特征,因此產生了數(shù)據分析的需求,在別的領域也存在相同的需求。
要實現(xiàn)智慧化應用,精細化管理和數(shù)據賦能尤為重要,畫像分析的概念也因此應運而生。畫像分析是指在大數(shù)據時代,通過對海量數(shù)據信息進行清洗、聚類、分析,將數(shù)據抽象成標簽,再利用這些標簽將業(yè)務實體形象具體化的過程,畫像分析能夠幫助用戶更好地開展針對性服務和監(jiān)管。
雖然目前市場上存在一些平臺或者系統(tǒng)通過標簽來刻畫目標對象,例如用戶畫像分析、廣告營銷以及企業(yè)畫像分析等,但是這些平臺或者系統(tǒng)存在僅能針對單一的業(yè)務對象進行分析,按特定的模板進行展示,應用范圍狹窄,無法實現(xiàn)跨應用以及自助多維分析等的缺點。
因此,如何提供一種基于標簽化的數(shù)據分析方法,實現(xiàn)提升數(shù)據分析的應用范圍,適用于各行業(yè),并能對數(shù)據進行自助多維分析,進而提升數(shù)據的應用價值,成為一個亟待解決的技術問題。
發(fā)明內容
本發(fā)明要解決的技術問題,在于提供一種基于標簽化的數(shù)據分析方法,實現(xiàn)提升數(shù)據分析的應用范圍,適用于各行業(yè),并能對數(shù)據進行自助多維分析,進而提升數(shù)據的應用價值。
本發(fā)明是這樣實現(xiàn)的:一種基于標簽化的數(shù)據分析方法,包括如下步驟:
步驟S10、從數(shù)據庫獲取各實體的原始數(shù)據;
步驟S20、定義一標簽體系、一計算規(guī)則以及一邏輯規(guī)則;
步驟S30、基于所述標簽體系、計算規(guī)則以及邏輯規(guī)則對各條原始數(shù)據進行打標簽,生成標簽數(shù)據;
步驟S40、對所述標簽數(shù)據進行分群;
步驟S50、對分群的所述標簽數(shù)據或者單個實體的標簽數(shù)據進行自助多維分析與展示。
進一步地,所述步驟S10具體為:
從各數(shù)據庫獲取待分析的各實體的原始數(shù)據,并對所述原始數(shù)據進行解析和適配,轉換為格式統(tǒng)一的數(shù)據。
進一步地,所述步驟S20具體為:
依據業(yè)務需求定義一包括至少一個標簽的標簽體系;各所述標簽均包括一標簽屬性以及一標簽生成規(guī)則;各所述標簽均基于所述標簽屬性設定上一層級的標簽,即父節(jié)點,進而建立樹形結構的標簽體系;
定義一包括計算表達式的計算規(guī)則以及一包括邏輯表達式的邏輯規(guī)則,用于依據所述標簽生成規(guī)則對原始數(shù)據進行計算。
進一步地,所述標簽屬性至少包括名稱、業(yè)務分類、存儲類型、經緯度以及取值范圍;所述業(yè)務分類至少包括事實型、規(guī)則型、統(tǒng)計型以及復雜型;所述存儲類型包括數(shù)值、字符、地理位置以及枚舉;所述標簽生成規(guī)則為各條原始數(shù)據與標簽屬性進行一一對應的規(guī)則。
進一步地,所述步驟S30具體包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于長威信息科技發(fā)展股份有限公司,未經長威信息科技發(fā)展股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911344104.3/2.html,轉載請聲明來源鉆瓜專利網。
- 數(shù)據顯示系統(tǒng)、數(shù)據中繼設備、數(shù)據中繼方法、數(shù)據系統(tǒng)、接收設備和數(shù)據讀取方法
- 數(shù)據記錄方法、數(shù)據記錄裝置、數(shù)據記錄媒體、數(shù)據重播方法和數(shù)據重播裝置
- 數(shù)據發(fā)送方法、數(shù)據發(fā)送系統(tǒng)、數(shù)據發(fā)送裝置以及數(shù)據結構
- 數(shù)據顯示系統(tǒng)、數(shù)據中繼設備、數(shù)據中繼方法及數(shù)據系統(tǒng)
- 數(shù)據嵌入裝置、數(shù)據嵌入方法、數(shù)據提取裝置及數(shù)據提取方法
- 數(shù)據管理裝置、數(shù)據編輯裝置、數(shù)據閱覽裝置、數(shù)據管理方法、數(shù)據編輯方法以及數(shù)據閱覽方法
- 數(shù)據發(fā)送和數(shù)據接收設備、數(shù)據發(fā)送和數(shù)據接收方法
- 數(shù)據發(fā)送裝置、數(shù)據接收裝置、數(shù)據收發(fā)系統(tǒng)、數(shù)據發(fā)送方法、數(shù)據接收方法和數(shù)據收發(fā)方法
- 數(shù)據發(fā)送方法、數(shù)據再現(xiàn)方法、數(shù)據發(fā)送裝置及數(shù)據再現(xiàn)裝置
- 數(shù)據發(fā)送方法、數(shù)據再現(xiàn)方法、數(shù)據發(fā)送裝置及數(shù)據再現(xiàn)裝置





