[發(fā)明專利]一種基于科技媒體云計算非結構化數(shù)據(jù)處理方法在審
| 申請?zhí)枺?/td> | 201310399024.4 | 申請日: | 2013-09-05 |
| 公開(公告)號: | CN104424309A | 公開(公告)日: | 2015-03-18 |
| 發(fā)明(設計)人: | 渠繼永 | 申請(專利權)人: | 清控科創(chuàng)控股股份有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京市蘭臺律師事務所 11354 | 代理人: | 張峰 |
| 地址: | 100084 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 科技 媒體 計算 結構 數(shù)據(jù)處理 方法 | ||
1.一種基于科技媒體云計算非結構化數(shù)據(jù)處理方法,其特征在于,主要由以下步驟組成:
(1)、進行科技媒體信息數(shù)據(jù)的獲取,得到待處理的非結構化數(shù)據(jù);
(2)、對非結構化數(shù)據(jù),根據(jù)不同類型的特征進行分布式云存儲;
(3)、對步驟(2)中云存儲的非結構化數(shù)據(jù),調用后進行離線處理,離線處理包括:清洗、排重、關聯(lián)、過濾、關鍵詞提取和智能歸類,然后將離線處理后的非結構化數(shù)據(jù)更新到云存儲中;
(4)、根據(jù)非結構化數(shù)據(jù)的特征,對收到信息檢索請求進行回應,檢索結果序列按照非結構化數(shù)據(jù)的特征進行展示。
2.如權利要求1所述的一種基于科技媒體云計算非結構化數(shù)據(jù)處理方法,其特征在于:步驟(1)中,科技媒體信息數(shù)據(jù)獲取的渠道包括人工錄入和互聯(lián)網(wǎng)抓取兩種方式。
3.如權利要求1所述的一種基于科技媒體云計算非結構化數(shù)據(jù)處理方法,其特征在于:步驟(3),對非結構化數(shù)據(jù)進行的調用及其后的離線處理,由大型分布式計算平臺完成。
4.如權利要求1所述的一種基于科技媒體云計算非結構化數(shù)據(jù)處理方法,其特征在于:對于步驟(4),檢索結果序列同時儲存在緩存中。
5.如權利要求4所述的一種基于科技媒體云計算非結構化數(shù)據(jù)處理方法,其特征在于:步驟(4),將緩存中的檢索結果序列直接更新到云存儲中或者經(jīng)過離線處理后再進行云存儲。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清控科創(chuàng)控股股份有限公司,未經(jīng)清控科創(chuàng)控股股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310399024.4/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。





