[發明專利]一種結構化數據搜索方法在審
| 申請號: | 201410314941.2 | 申請日: | 2014-07-02 |
| 公開(公告)號: | CN104123346A | 公開(公告)日: | 2014-10-29 |
| 發明(設計)人: | 蘇凱;吳廣財;桂媛;陳非 | 申請(專利權)人: | 廣東電網公司信息中心 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 廣州知友專利商標代理有限公司 44104 | 代理人: | 周克佑 |
| 地址: | 510080 廣東省廣州*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 結構 數據 搜索 方法 | ||
1.一種結構化數據搜索方法,其特征在于包括以下步驟:
步驟A:對數據倉庫的數據進行技術標準化,得到進行技術標準化后擴展的所有事實表和維度表:
a1.將已有數據倉庫標準化為事實表和維度表的模式;
a2.將已有數據倉庫標準化為星型模型;
a3.在已有數據倉庫,對于存在笛卡兒乘積的維度表都轉化為單一維度的維度表;
步驟B:建立搜索模型的配置參數表;
根據步驟A的結果配置參數表,配置參數表由度量配置參數表、維度配置參數表和維度值配置參數表3張表構成;
所述度量配置參數表包括的數據項為度量名稱、所屬表名、度量對應字段名和數據聚合特征;所述維度配置參數表的數據項主要包括維度名稱、所屬表名、維度字段名、維度表主鍵和優先級別,其中優先級別是一個排列序號,0最高,數字越大優先級越小;所述維度值配置參數表包括維度值、所屬表名、維度字段名、維度表主鍵;
步驟C:根據配置參數表生成搜索模型表:通過SQL語句插入的方式,生成搜索模型表,搜索模型表的字段包括:索引名、類型、表名、字段名、維度表ID、聚合特征;3張配置參數表中的每一行數據對應生成搜索模型表中的一條數據,即搜索模型表的數據是3張配置參數表的數據之和,其中類型區分來自與不同的配置表;
步驟D:根據搜索模型表,實現結構化數據搜索,所述搜索過程為:
首先根據用戶的輸入信息進行分詞處理,將輸入參數拆分為多個單獨的索引;再根據拆分出的索引,在搜索模型表中找到各個索引的對應屬性;根據屬性類型生成查詢語句,對于度量和維度,放到查詢語句的SELECT中,而維度值則放到WHERE的限制語句中,并得到查詢結果。
2.根據權利要求1所述的方法,其特征在于:所述將已有數據倉庫標準化為事實表和維度表的模式的具體過程為:已有數據倉庫有源數據表D包含A1、A2、…An,B1、B2、…Bm,其中A1-An為枚舉型的文本值或數值,B1-Bm為數字型的度量值,則將源數據表D拆分為一個事實表Fmn和n個維度表(DA1-DAn)組成,事實表Fmn的構成是A1ID、A2ID、…AnID,B1、B2、…Bm,其中A1ID、A2ID、…AnID分別和n個維度表進行關聯,每個維度表Ai的構成是AiID、AiName;其中AiID是指維度Ai的ID,即唯一的數字標示;AiName是指維度表Ai的Name,即名稱。
3.根據權利要求1所述的方法,其特征在于:還包括搜索模型的更新和自我學習過程:在步驟B中建立的3張配置表可以覆蓋數據倉庫中所有的度量和維度,當數據倉庫中的模型發生變更時,所述變更包括:新增、修改或刪除,配置參數表也需要進行對應的變更操作,當3張配置參數表變更完成后,步驟C中的數據搜索模型也需要重新生成。
4.根據權利要求1所述的方法,其特征在于:所述步驟B還包括配置索引映射關系表的過程,所述索引映射關系表用來進行索引名稱的模糊匹配,所述索引映射關表表結構為:標準索引名、模糊匹配名稱;所述索引映射關系表的初始值根據常規邏輯,手工進行維護,后續根據用戶搜索習慣,逐步豐富完善,形成針對具體業務的匹配詞庫。
5.根據權利要求1所述的方法,其特征在于:所述數據聚合特征是指度量值的結果聚合方式,具體包括6類特征:求和、最大值、最小值、平均值、計數、無。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東電網公司信息中心,未經廣東電網公司信息中心許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410314941.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:光電陰極制備工藝
- 下一篇:一種有利于減少繞線成本的繞線機構
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





