[發明專利]一種結構化數據搜索方法在審
| 申請號: | 201410314941.2 | 申請日: | 2014-07-02 |
| 公開(公告)號: | CN104123346A | 公開(公告)日: | 2014-10-29 |
| 發明(設計)人: | 蘇凱;吳廣財;桂媛;陳非 | 申請(專利權)人: | 廣東電網公司信息中心 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 廣州知友專利商標代理有限公司 44104 | 代理人: | 周克佑 |
| 地址: | 510080 廣東省廣州*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 結構 數據 搜索 方法 | ||
技術領域
本發明涉及數據搜索技術領域,具體的說,是涉及一種結構化數據搜索模型的構造方法。?
背景技術
在大數據時代企業日常生產運營過程中積累了海量的業務數據信息,但是這些有價值的信息常常分散在企業的各個角落,如何更好的體現數據價值,讓用戶從海量數據中快速搜索出自己想要的業務數據內容,而不是僅僅提供固定的定制化分析報表,是企業在商務智能分析中面臨的一個重要挑戰。?
傳統的商務智能產品,都是基于數據倉庫的基礎之上,通過語義的過程,將技術語言轉化為易于理解的業務語言,再通過業務需求定制開發不同的報表和儀表盤,實現按需定制開發的功能。由于業務需求的變化越來越快,無法實現快速定制,快速響應用戶需求,需要對數據結構模型進行優化,以提供一種類似于搜索引擎的結構化數據搜索服務方法,為用戶提供快速的數據分析服務響應。所謂結構化數據是指即行數據,存儲在數據庫里,可以用二維表結構來邏輯表達實現的數據。這種方式需要能夠超越傳統BI的數據交付模式,提供了更好的用戶體驗。?
發明內容
本發明的目的在于提供一種結構化數據搜索方法,本方法能夠實現通過自然語言查詢,來搜索海量的結構化數據信息。?
本發明通過如下技術方案實現上述發明目的:?
一種結構化數據搜索方法,包括以下步驟:?
步驟A:對數據倉庫的數據進行技術標準化。?
對已有數據倉庫中的數據進行標準化,所述數據標準化過程就是通過SQL語言進行數據擴展,即保持原有數據倉庫的表結構和數據不變,利用SQL語言生成新的表結構和數據,主要包含三個步驟:?
a1.將已有數據倉庫標準化為事實表和維度表的模式,具體過程為:已有數據倉庫有源數據表D包含A1、A2、…An,B1、B2、…Bm,其中A1-An為枚舉型的文本值或數值,B1-Bm為數字型的度量值,則將源數據表D拆分為一個事實表Fmn和n個維度表(DA1-DAn)組成,事實表Fmn的構成是A1ID、A2ID、…AnID,B1、B2、…Bm,其中A1ID、A2ID、…AnID分別和n個維度表進行關聯,每個維度表Ai的構成是AiID、AiName。所謂AiID是指維度Ai的ID,即唯一的數字標示;AiName是指維度表Ai的Name,即名稱,如:有性別維度,存在兩個維度值,則有性別維度ID{0,1},對應的性別名稱{‘男’,‘女’}。所謂性別維度表對應Ai,性別名稱對應AiName,{0,1}對應的是ID。?
a2.將已有數據倉庫標準化為星型模型,如:在雪花形模型中,事實表Fmn中的客戶ID關聯客戶維度表Ai中的客戶主鍵AiID,而客戶維度表中又存在客戶分類ID關聯到客戶分類維度表D1中的客戶分類ID,則將客戶維度表中的客戶分類ID放到事實表Fmn中和客戶分類維度表D1的客戶分類ID直接進行關聯。所述客戶分類維度表是存放客戶分類信息的維度表,也是對數據倉庫中維度表的細分。?
a3.在已有數據倉庫,對于存在笛卡兒乘積的維度表都轉化為單一維度的維度表,如:笛卡兒乘積的維度表P是由A、B、C3個維度組成,則將維度表P拆分為3個維度表分別對應維度表A、維度表B、維度表C,同時將事實表中和維度表P關聯的維度ID拆分為三個維度ID,分別關聯A、B、C三個維度表中的維度ID。?
經過步驟A,得到進行技術標準化后擴展的所有事實表和維度表,即技術標準化后的數據模型。?
步驟B:建立搜索模型的配置參數表。?
基于步驟A得到的技術標準化后的數據模型進行參數表的配置,得到配置參數表。配置參數表由度量配置參數表、維度配置參數表和維度值配置參數表3張表構成。?
其中度量配置參數表包括的數據項為度量名稱、所屬表名、度量對應字段名和數據聚合特征。數據聚合特征是指該度量值的結果聚合方式,具體包括6類特?征:求和、最大值、最小值、平均值、計數、無。?
維度配置參數表的數據項主要包括維度名稱、所屬表名、維度字段名、維度表主鍵和優先級別,其中優先級別是一個排列序號,0最高,數字越大優先級越小。?
維度配置參數表包括維度值、所屬表名、維度字段名、維度表主鍵。?
步驟C:搜索模型的生成。?
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東電網公司信息中心,未經廣東電網公司信息中心許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410314941.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:光電陰極制備工藝
- 下一篇:一種有利于減少繞線成本的繞線機構
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





