[發明專利]出版物數字資源的自動采集方法及系統有效
| 申請號: | 201310385324.7 | 申請日: | 2013-08-29 |
| 公開(公告)號: | CN104424271B | 公開(公告)日: | 2018-10-16 |
| 發明(設計)人: | 百華睿;陳長剛 | 申請(專利權)人: | 北大方正集團有限公司;方正信息產業控股有限公司;北京北大方正電子有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京英賽嘉華知識產權代理有限責任公司 11204 | 代理人: | 王達佐 |
| 地址: | 100871 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 出版物 數字 資源 自動 采集 方法 系統 | ||
1.一種出版物數字資源的自動采集方法,其特征在于,包括:
獲取出版物數字資源中的資源文件;
根據預設的識別規則對所述資源文件進行識別,得到識別結果,所述識別結果包括:文件類型、文件關系及排序;
將所述資源文件上傳到服務器;
根據所述識別結果生成所述資源文件的屬性信息;
將所述屬性信息存儲到數據庫中;其中,
所述根據所述識別結果生成所述資源文件的屬性信息包括:
根據所述識別結果生成XML格式的通知文件;
解析所述通知文件,得到所述資源文件的屬性信息。
2.根據權利要求1所述的方法,其特征在于,所述方法還包括:
獲取并解析XML格式的配置文件,從中得到所述識別規則。
3.根據權利要求1所述的方法,其特征在于,所述方法還包括:
在得到所述識別結果后,向用戶展現手動修改操作界面,以使用戶在所述操作界面上調整文件的類型、文件關系及排序。
4.根據權利要求1至3任一項所述的方法,其特征在于,所述方法還包括:
從數據庫讀取資源文件的屬性信息,并在瀏覽器中進行展示所述屬性信息。
5.一種出版物數字資源的自動采集系統,其特征在于,包括:
獲取模塊,用于獲取出版物數字資源中的資源文件;
識別模塊,用于根據預設的識別規則對所述資源文件進行識別,得到識別結果,所述識別結果包括:文件類型、文件關系及排序;
上傳模塊,用于將所述資源文件上傳到服務器;
資源入庫模塊,用于根據所述識別結果生成所述資源文件的屬性信息,并將所述屬性信息存儲到數據庫中;其中,
所述資源入庫模塊包括:
解析單元,用于從所述識別模塊獲取XML格式的通知文件,解析所述XML文件得到資源文件的屬性信息;
入庫單元,用于將所述屬性信息存儲進數據庫。
6.根據權利要求5所述的系統,其特征在于,
所述識別模塊,還用于獲取并解析XML格式的配置文件,從中得到所述識別規則。
7.根據權利要求5所述的系統,其特征在于,所述系統還包括:
展現模塊,用于在所述識別模塊得到識別結果后,向用戶展現手動修改操作界面,以使用戶在所述操作界面上調整文件的類型、文件關系及排序。
8.根據權利要求5至7任一項所述的系統,其特征在于,所述系統還包括:
資源管理模塊,用于從數據庫讀取資源文件的屬性信息,并在瀏覽器中進行展示所述屬性信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北大方正集團有限公司;方正信息產業控股有限公司;北京北大方正電子有限公司,未經北大方正集團有限公司;方正信息產業控股有限公司;北京北大方正電子有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310385324.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種對搜索結果進行排序的方法及裝置
- 下一篇:數字資源管理方法及系統





