[發明專利]一種對文件內容與元數據進行組織管理的方法有效
| 申請號: | 201210144951.7 | 申請日: | 2012-05-10 |
| 公開(公告)號: | CN102693286A | 公開(公告)日: | 2012-09-26 |
| 發明(設計)人: | 曹強;黃建忠;葉松;楊樂;謝長生 | 申請(專利權)人: | 華中科技大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 華中科技大學專利中心 42201 | 代理人: | 曹葆青 |
| 地址: | 430074 湖北*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 文件 內容 數據 進行 組織 管理 方法 | ||
技術領域
本發明屬于計算機數據存儲領域,尤其涉及一種對文件內容與元數據進行組織管理的方法。該方法將文件內容與元數據合并存儲,在文件內部實現對文件內容與元數據的組織管理,使文件具有自描述性。
背景技術
隨著信息技術的發展,新的數據類型不斷出現,包含了豐富的元數據(metadata),元數據用于描述要素、數據集或數據集系列的內容、覆蓋范圍、質量、管理方式、數據的所有者、數據的提供方式等有關的信息。傳統文件系統技術信息自描述能力不強,沒有對元數據擴展提供足夠的支持,不能為操作系統提供文件語義結構的信息,導致用戶無法有效組織與管理海量文件。
由于操作系統將文件視為無意義的數據流。為了支持元數據,一種方法是在用戶數據的頭部存放通用的元數據信息,比如數碼照片的EXIF(Exchangeable?Image?File?Format)元數據頭在照片拍攝時就存儲在該照片數據的頭部。但是目前只有圖片與音頻、視頻等個別特殊格式的文件擁有文件的內部結構來存儲相應的元數據,格式千差萬別,并且難于對元數據進行統一管理,同時也依賴應用程序對文件元數據進行提取與管理。
為了充分利用文件的元數據信息,學術界提出了各種解決方案,比較有代表性的是借助數據庫管理技術與語義文件系統。基于關系模型的數據庫將文件與元數據之間的關聯存放在表中,并通過索引技術進行快速查找,但是數據庫本身過于復雜,并且不能精確將半結構化數據映射為結構化的表。語義文件系統利用元數據抽取工具獲得文件的元數據,并可以記錄用戶的活動并對文件進行標注,將文件元數據組織為<key,value>鍵值對的形式,實現統一元數據。文件的元數據信息存放在數據庫文件或XML文件中。通過關系數據庫等工具管理元數據,實現基于文件屬性的文件系統訪問。若使用XML文件存儲元數據,需要時對內容進行解析,XML文件需要駐留內存,當文件元數據規模增大時開銷較大。
傳統的文件組織方式導致文件的自描述性不強,目前這些技術將文件元數據存放在文件系統之上,或者僅限于特定格式,無法統一管理,或者在傳統文件系統的基礎上手動額外增加了語義結構,本身不具有自描述的結構特性并且元數據與文件內容相分離,依賴數據庫等特定應用程序。
發明內容
本發明的目的在于提供一種對文件內容與元數據進行組織管理的方法,該方法不局限于特定格式的文件,在文件內部實現元數據的自組織與自我管理,增加了文件的自描述性,消除了對特定格式與數據庫等的信賴。在本發明中提到的文件屬性與文件元數據等價。
本發明提供的一種對文件內容與元數據進行組織管理的方法,其特征在于,該方法按照下述步驟對原有文件進行組織管理,生成新格式文件:
第A1步建立內容為空的新文件;
第A2步將新的文件按照上述邏輯結構劃分成三個區域:文件結構描述塊組,數據塊組和屬性塊組;其中,文件結構描述塊,包括三個部分:內部描述塊,屬性塊位圖和數據塊位圖,內部描述塊用來描述文件的內部結構、文件數據與元數據的分布信息,屬性塊位圖與數據塊位圖保存屬性塊與數據塊的位置信息以及對應的塊大小信息;數據塊組用于保存原文件的數據內容,通過數據塊位圖查找訪問;屬性塊組用于保存原文件的屬性內容,通過屬性塊位圖查找訪問;
第A3步若原有文件為空文件,則跳至第A6步,否則進入第A4步;
第A4步獲取原有文件的所有元數據信息,轉換為屬性描述信息,逐個寫入屬性塊組,記錄屬性塊組的信息,并更新文件結構描述塊組中對應的屬性塊位圖中的LBA地址信息;獲取原有文件的文件內容,寫入數據塊組,記錄數據塊組的信息,并更新文件結構描述塊組中對應的數據塊位圖中的LBA地址信息;
第A5步更新內部描述塊中其他描述文件內部結構的信息;
第A6步得到新格式文件,其中數據塊組對應著原文件的文件內容,屬性塊組對應著原文件的元數據信息。
本發明提供的按照上述方法生成的文件的訪問方法,其特征在于,該方法包括下述步驟:
第B1步系統根據用戶的訪問請求的具體描述,檢索文件系統中的位置文件Bitmap或FAT表;若文件存在則得到文件的LBA首地址,進入第B2步,否則,文件不存在,轉入第B6步;
第B2步由文件LBA首地址讀取文件結構描述塊;
第B3步如果請求對象為文件數據,則抽取結構描述塊中的對應的數據描述信息以及數據塊位圖的LBA地址;如果請求對象為文件屬性,則抽取結構描述塊中的屬性描述信息以及屬性塊位圖的LBA地址;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華中科技大學,未經華中科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210144951.7/2.html,轉載請聲明來源鉆瓜專利網。
- 內容再現系統、內容提供方法、內容再現裝置、內容提供裝置、內容再現程序和內容提供程序
- 內容記錄系統、內容記錄方法、內容記錄設備和內容接收設備
- 內容服務系統、內容服務器、內容終端及內容服務方法
- 內容分發系統、內容分發裝置、內容再生終端及內容分發方法
- 內容發布、內容獲取的方法、內容發布裝置及內容傳播系統
- 內容提供裝置、內容提供方法、內容再現裝置、內容再現方法
- 內容傳輸設備、內容傳輸方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容發送設備、內容發送方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容再現裝置、內容再現方法、內容再現程序及內容提供系統
- 內容記錄裝置、內容編輯裝置、內容再生裝置、內容記錄方法、內容編輯方法、以及內容再生方法
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





