[發明專利]一種科技媒體云計算非結構化數據解決方案在審
| 申請號: | 201410290070.5 | 申請日: | 2014-06-26 |
| 公開(公告)號: | CN105224563A | 公開(公告)日: | 2016-01-06 |
| 發明(設計)人: | 渠繼永 | 申請(專利權)人: | 清控科創控股股份有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100080 北京市海淀區中*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 科技 媒體 計算 結構 數據 解決方案 | ||
1.一種科技媒體云計算非結構化數據解決方案,其特征在于:包括科技媒體信息數據的獲取、非結構化數據的存儲系統、數據的離線處理和信息的查詢檢索系統,所述科技媒體信息數據的獲取可以從系統后臺很方便的人工錄入,也可以從互聯網上系統自動的抓取,所述人工錄入和互聯網抓取的輸出端與科技媒體信息數據的獲取的輸入端相連接,所述科技媒體信息數據的獲取的輸出端與非結構化數據的存儲系統的輸入端相連,所述非結構化數據的存儲系統的輸入端與數據的離線處理的輸出端相連,所述數據的離線處理的輸入端連接有分布式計算平臺,所述非結構化數據的存儲系統的輸出端與信息的查詢檢索系統的輸入端相連,所述信息的查詢檢索系統的輸出端連接有緩存系統,所述信息的查詢檢索系統的輸出端還連接有信息展示平臺。
2.根據權利要求1所述的科技媒體云計算非結構化數據解決方案,其特征在于:所述科技媒體信息數據從人工錄入和互聯網抓取兩個方法進行獲取,且人工錄入和互聯網抓取的輸出端與科技媒體信息數據的獲取的輸入端相連。
3.根據權利要求1所述的科技媒體云計算非結構化數據解決方案,其特征在于:所述非結構化數據的存儲系統在云存儲系統中將第一步獲取的數據按照不同類型的非結構化數據特征進行存儲,采用能支持大容量、高性能的Hadoop+HBase的體系結構。
4.根據權利要求1所述的科技媒體云計算非結構化數據解決方案,其特征在于:所述數據的離線處理,調用大型分布式計算平臺對存儲的數據進行清洗、排重、關聯、過濾、關鍵詞提取、智能歸類等操作,并將處理后的數據更新到云存儲系統中。
5.根據權利要求1所述的科技媒體云計算非結構化數據解決方案,其特征在于:所述信息的查詢檢索系統在系統收到客戶的檢索請求后,進入非結構化檢索,從云存儲系統中取出非結構的源數據返回給客戶端,并將查詢結果緩存起來。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清控科創控股股份有限公司,未經清控科創控股股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410290070.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:文字緩存方法及裝置
- 下一篇:一種基于快速像素過濾的三維全景圖片采集方法





