[發明專利]一種基于MongoDB和Solr的海量數據存儲及快速檢索方法在審
| 申請號: | 201910341618.7 | 申請日: | 2019-04-26 |
| 公開(公告)號: | CN110232106A | 公開(公告)日: | 2019-09-13 |
| 發明(設計)人: | 王利梅;唐飛;何丹娜;張海榮;吳濤;李凱;聞志;吳愛清;沙健;熊飛;劉江明;尚兵兵;王微;楊良闖;周小將;陳迪宇;朱志超;唐杰;王文杰;汪志發;舒貴陽;李慧;胡昊 | 申請(專利權)人: | 安徽四創電子股份有限公司 |
| 主分類號: | G06F16/31 | 分類號: | G06F16/31;G06F16/33;G06F16/332 |
| 代理公司: | 合肥和瑞知識產權代理事務所(普通合伙) 34118 | 代理人: | 王挺 |
| 地址: | 230088 安徽省合肥*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 非結構化數據 快速檢索 唯一編碼 資源信息 索引信息 海量數據存儲 存儲 查詢語句 索引庫 查找 調用 數據庫存儲 快速獲取 創建 數據庫 | ||
1.一種基于MongoDB和Solr的海量數據存儲及快速檢索方法,其特征在于,對于非結構化數據的存儲,包括以下具體步驟:
S101,獲取到非結構化數據后,調用MongoDB數據庫存儲該非結構化數據的信息,即將該非結構化數據存儲至MongoDB數據庫中,并為該非結構化數據創建與其對應的MongoDB資源信息唯一編碼;
且每一個非結構化數據均對應一個MongoDB資源信息唯一編碼;
S102,調用Solr創建該非結構化數據的索引信息,并將該非結構化數據的索引信息和MongoDB資源信息唯一編碼存儲至Solr的存儲空間即索引庫中;
對于非結構化數據的檢索,包括以下具體步驟:
S201,輸入檢索條件進行非結構化數據的檢索,Solr根據該檢索條件創建查詢語句;
S202,Solr先根據該查詢語句在Solr的索引庫中進行查找,查找出與該查詢語句相對應的非結構化數據的索引信息,以及該索引信息所對應的MongoDB資源信息唯一編碼;
S203,再根據該對應的MongoDB資源信息唯一編碼在MongoDB數據庫中進行查找,查找出該MongoDB資源信息唯一編碼所對應的非結構化數據的信息。
2.根據權利要求1所述的一種基于MongoDB和Solr的海量數據存儲及快速檢索方法,其特征在于,步驟S101中,調用MongoDB的API接口存儲非結構化數據的信息;步驟S203中,調用MongoDB的API接口獲取非結構化數據的信息。
3.根據權利要求1所述的一種基于MongoDB和Solr的海量數據存儲及快速檢索方法,其特征在于,步驟S102中,調用SolrJ接口將該非結構化數據的索引信息和MongoDB資源信息唯一編碼存儲至Solr的索引庫中。
4.根據權利要求1所述的一種基于MongoDB和Solr的海量數據存儲及快速檢索方法,其特征在于,步驟S102中,調用Solr中的basic_config配置創建該非結構化數據的索引信息。
5.根據權利要求1所述的一種基于MongoDB和Solr的海量數據存儲及快速檢索方法,其特征在于,步驟S201中,調用SolrJ接口創建查詢語句。
6.根據權利要求1所述的一種基于MongoDB和Solr的海量數據存儲及快速檢索方法,其特征在于,非結構化數據包括視頻數據、圖片數據、其他數據;所述其他數據是指文檔類的數據,包括Word、Excel、Pdf數據;
MongoDB數據庫存儲有不同類型的非結構化數據;Solr索引庫存儲有不同類型的非結構化數據的索引信息和MongoDB資源信息唯一編碼。
7.根據權利要求6所述的一種基于MongoDB和Solr的海量數據存儲及快速檢索方法,其特征在于,步驟S202中,SolrCloud平臺接收所創建的查詢語句,并在Solr的索引庫中針對不同類型的非結構化數據進行分布式查找,查找出與該查詢語句相對應的非結構化數據的索引信息,以及該索引信息所對應的MongoDB資源信息唯一編碼。
8.根據權利要求1所述的一種基于MongoDB和Solr的海量數據存儲及快速檢索方法,其特征在于,步驟S201中,引入Solr的中文分詞機制,以實現全文檢索。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于安徽四創電子股份有限公司,未經安徽四創電子股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910341618.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種路網數據的編譯方法及裝置
- 下一篇:一種產品數據獲取方法





