[發明專利]一種存儲系統檢索文件內容的方法和設備在審
| 申請號: | 202110354363.5 | 申請日: | 2021-04-01 |
| 公開(公告)號: | CN113127421A | 公開(公告)日: | 2021-07-16 |
| 發明(設計)人: | 王勇 | 申請(專利權)人: | 山東英信計算機技術有限公司 |
| 主分類號: | G06F16/14 | 分類號: | G06F16/14;G06F16/13;G06F16/174 |
| 代理公司: | 北京連和連知識產權代理有限公司 11278 | 代理人: | 劉小峰;宋薇薇 |
| 地址: | 250101 山東省濟南市高新區*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 存儲系統 檢索 文件 內容 方法 設備 | ||
本發明提供了一種存儲系統檢索文件內容的方法和設備,該方法包括:將存儲系統中的每個文件內容按照預設大小劃分成多個部分;計算每個部分的Hash值,并將計算得到的Hash值在存儲系統中進行匹配;響應于存儲系統中沒有匹配到與計算得到的Hash值相同的Hash值,將計算得到的Hash值保存到存儲系統中;基于文件內容和計算得到的Hash值建立文件Hash值鏈表;響應于接收到檢索文件的指令,計算每個檢索詞的Hash值并將每個檢索詞的Hash值在文件Hash值鏈表中進行匹配以檢索文件。通過使用本發明的方案,能夠節省數據的存儲空間,提高文件的檢索效率,提高產品競爭力。
技術領域
本領域涉及計算機領域,并且更具體地涉及一種存儲系統檢索文件內容的方法和設備。
背景技術
在云計算時代,海量數據的產生即需要大容量的存儲空間,也需要在海量的數據中快速的檢索所目標文件內容。傳統的文件檢索采用目錄樹的方式,將文件的大小、時間信息甚至文件本身的結構化信息存入文件的元數據區域。這種方式可以很好的進行文件的文件名檢索和文件內容特定關鍵信息的檢索,但隨著目錄樹的層數加深,文件的檢索效率也將大大折扣,而且也不能對整個文件內容進行檢索,也存在重復內容的文件占用存儲空間的問題。
發明內容
有鑒于此,本發明實施例的目的在于提出一種存儲系統檢索文件內容的方法和設備,通過使用本發明的技術方案,能夠節省數據的存儲空間,提高文件的檢索效率,提高產品競爭力。
基于上述目的,本發明的實施例的一個方面提供了一種存儲系統檢索文件內容的方法,包括以下步驟:
將存儲系統中的每個文件內容按照預設大小劃分成多個部分;
計算每個部分的Hash值,并將計算得到的Hash值在存儲系統中進行匹配;
響應于存儲系統中沒有匹配到與計算得到的Hash值相同的Hash值,將計算得到的Hash值保存到存儲系統中;
基于文件內容和計算得到的Hash值建立文件Hash值鏈表;
響應于接收到檢索文件的指令,計算每個檢索詞的Hash值并將每個檢索詞的Hash值在文件Hash值鏈表中進行匹配以檢索文件。
根據本發明的一個實施例,還包括:
記錄每個部分在文件中的順序。
根據本發明的一個實施例,基于文件內容和計算得到的Hash值建立文件Hash值鏈表包括:
將文件中的每個部分的Hash值按照順序進行排列;
建立每個部分的Hash值與每個部分的文件內容的對應關系。
根據本發明的一個實施例,響應于接收到檢索文件的指令,計算每個檢索詞的Hash值并將每個檢索詞的Hash值在文件Hash值鏈表中進行匹配以檢索文件包括:
將檢索詞的Hash值中的第一個在所有的文件Hash值鏈表中進行匹配;
響應于第一個檢索詞的Hash值在文件Hash值鏈表中存在,返回第一個檢索詞的Hash值對應的文件名稱;
將檢索詞的Hash值中的第二個在返回的文件名稱的文件Hash值鏈表中進行匹配;
響應于第二個檢索詞的Hash值在文件Hash值鏈表中存在,返回第二個檢索詞的Hash值對應的文件名稱;
繼續依次匹配其他關鍵詞的Hash值直到檢索到目標文件。
根據本發明的一個實施例,還包括:
將計算得到的Hash值通過Base58進行編碼。
本發明的實施例的另一個方面,還提供了一種存儲系統檢索文件內容的設備,設備包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山東英信計算機技術有限公司,未經山東英信計算機技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110354363.5/2.html,轉載請聲明來源鉆瓜專利網。
- 內容再現系統、內容提供方法、內容再現裝置、內容提供裝置、內容再現程序和內容提供程序
- 內容記錄系統、內容記錄方法、內容記錄設備和內容接收設備
- 內容服務系統、內容服務器、內容終端及內容服務方法
- 內容分發系統、內容分發裝置、內容再生終端及內容分發方法
- 內容發布、內容獲取的方法、內容發布裝置及內容傳播系統
- 內容提供裝置、內容提供方法、內容再現裝置、內容再現方法
- 內容傳輸設備、內容傳輸方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容發送設備、內容發送方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容再現裝置、內容再現方法、內容再現程序及內容提供系統
- 內容記錄裝置、內容編輯裝置、內容再生裝置、內容記錄方法、內容編輯方法、以及內容再生方法





