[發明專利]基于容器的文本收集方法及其系統有效
| 申請號: | 201810168673.6 | 申請日: | 2018-02-28 |
| 公開(公告)號: | CN108363802B | 公開(公告)日: | 2021-10-29 |
| 發明(設計)人: | 古文;徐葉;顧正 | 申請(專利權)人: | 深圳市華云中盛科技股份有限公司 |
| 主分類號: | G06F16/13 | 分類號: | G06F16/13;G06F16/182;G06F16/11 |
| 代理公司: | 深圳市精英專利事務所 44242 | 代理人: | 馮筠 |
| 地址: | 518000 廣東省深圳市南山區粵海街道麻嶺*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 容器 文本 收集 方法 及其 系統 | ||
1.基于容器的文本收集方法,其特征在于,所述方法包括:
獲取被收集容器產生的文本文件,并將文本文件掛載至數據卷中;
將文本收集容器運行至被收集容器的同一節點中;
將數據卷掛載至文本收集容器中;
掃描數據卷內文本文件的內容;
判斷數據卷內的文本文件是否發生變化;
若是,則獲取文本文件的變化內容,對變化內容進行分類處理并存儲;
若否,則返回掃描數據卷內文本文件的內容的步驟;
獲取文本文件的變化內容,對變化內容進行分類處理并存儲的步驟,包括以下具體步驟:
獲取文本文件的變化內容;
將文本文件的變化內容掛載至文本收集容器的共享存儲內;
針對共享存儲內的文本文件以文本收集容器的ID作為目錄名進行區分;
針對區分后的文本文件進行存儲;
針對區分后的文本文件進行存儲的步驟,包括以下具體步驟:
對共享存儲內的文本文件進行收集,形成待存儲文本文件;
對待存儲文本文件進行打標簽,形成帶標簽的文本文件;
將帶標簽的文本文件存儲于全文搜索引擎中。
2.基于容器的文本收集系統,其特征在于,包括文件掛載單元、容器運行單元、數據卷掛載單元、掃描單元、判斷單元以及文件處理單元;
所述文件掛載單元,用于獲取被收集容器產生的文本文件,并將文本文件掛載至數據卷中;
所述容器運行單元,用于將文本收集容器運行至被收集容器的同一節點中;
所述數據卷掛載單元,用于將數據卷掛載至文本收集容器中;
所述掃描單元,用于掃描數據卷內文本文件的內容;
所述判斷單元,用于判斷數據卷內的文本文件是否發生變化;
所述文件處理單元,用于若是,則獲取文本文件的變化內容,對變化內容進行分類處理并存儲;
所述文件處理單元包括內容獲取模塊、內容掛載模塊、區分模塊以及存儲模塊;
所述內容獲取模塊,用于獲取文本文件的變化內容;
所述內容掛載模塊,用于將文本文件的變化內容掛載至文本收集容器的共享存儲內;
所述區分模塊,用于針對共享存儲內的文本文件以文本收集容器的ID作為目錄名進行區分;
所述存儲模塊,用于針對區分后的文本文件進行存儲;
所述存儲模塊包括收集子模塊、打標簽子模塊以及引擎存儲子模塊;
所述收集子模塊,用于對共享存儲內的文本文件進行收集,形成待存儲文本文件;
所述打標簽子模塊,用于對待存儲文本文件進行打標簽,形成帶標簽的文本文件;
所述引擎存儲子模塊,用于將帶標簽的文本文件存儲于全文搜索引擎中。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市華云中盛科技股份有限公司,未經深圳市華云中盛科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810168673.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種地圖興趣點的檢索方法和裝置
- 下一篇:一種路由器實現文檔轉移的方法及系統





