[發(fā)明專利]資源庫中的資源采集方法和裝置在審
| 申請?zhí)枺?/td> | 201611032326.8 | 申請日: | 2016-11-22 |
| 公開(公告)號: | CN108090071A | 公開(公告)日: | 2018-05-29 |
| 發(fā)明(設(shè)計)人: | 侯勝濤 | 申請(專利權(quán))人: | 北大方正集團有限公司;北京北大方正電子有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京同立鈞成知識產(chǎn)權(quán)代理有限公司 11205 | 代理人: | 楊澤;劉芳 |
| 地址: | 100871 北京市海*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 引擎 資源庫 采集 采集信息 方法和裝置 網(wǎng)頁采集 網(wǎng)頁資源 資源采集 預(yù)設(shè)策略 配置 創(chuàng)建 應(yīng)用 | ||
本發(fā)明提供了一種資源庫中的資源采集方法和裝置,該方法包括:配置至少一種采集引擎和對應(yīng)的采集信息;創(chuàng)建采集引擎,并控制采集引擎根據(jù)對應(yīng)的采集信息對資源進行采集;其中,采集引擎包括:網(wǎng)頁采集引擎,相應(yīng)的,網(wǎng)頁采集引擎對應(yīng)的采集信息為網(wǎng)頁資源采集信息;控制采集引擎按照預(yù)設(shè)策略將采集的對應(yīng)的資源存入到資源庫中。由于采集的資源包括了網(wǎng)頁資源,極大的豐富了資源庫中的資源,使資源庫中的資源多樣化,能夠使資源庫在實際應(yīng)用中滿足需求。
技術(shù)領(lǐng)域
本發(fā)明實施例涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,尤其涉及一種資源庫中的資源采集方法和裝置。
背景技術(shù)
資源庫將一定范疇的數(shù)據(jù)甚至數(shù)據(jù)連接等通過歸納、整理,以一定格式存放,便于進行查閱和使用。資源庫在計算機、互聯(lián)網(wǎng)等領(lǐng)域都有廣泛的應(yīng)用。
現(xiàn)有技術(shù)中的資源庫中的資源只來源于XML、text等文件中的資源以及數(shù)據(jù)庫中的資源。對文件文件的資源進行采集時,通過對格式文件進行解析,獲取到需要獲取的文件文件,并存儲到資源庫中。對數(shù)據(jù)庫中的資源進行采集時,通過查詢數(shù)據(jù)庫中的字段,獲取到需要的數(shù)據(jù)庫資源,并存儲到資源庫中。
由于互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,使大量的資源不再局限于文件和數(shù)據(jù)庫,所以現(xiàn)有的資源庫中資源的采集途徑過于單一,無法使資源庫在實際應(yīng)用中滿足需求。
發(fā)明內(nèi)容
本發(fā)明實施例提供一種資源庫中的資源采集方法,該方法解決了現(xiàn)有技術(shù)中的資源庫中的資源采集方法途徑過于單一,無法使資源庫在實際應(yīng)用中滿足需求的技術(shù)問題。
本發(fā)明實施例提供一種資源庫中的資源采集方法,包括:
配置至少一種采集引擎和對應(yīng)的采集信息;
創(chuàng)建所述采集引擎,并控制所述采集引擎根據(jù)對應(yīng)的采集信息對對應(yīng)的資源進行采集;
其中,所述采集引擎包括:網(wǎng)頁采集引擎,相應(yīng)的,所述網(wǎng)頁采集引擎對應(yīng)的采集信息為網(wǎng)頁資源采集信息;
控制所述采集引擎按照預(yù)設(shè)策略將所述采集的對應(yīng)的資源存入到資源庫中。
本發(fā)明實施例提供一種資源庫中的資源采集裝置,包括:
配置模塊,用于配置至少一種采集引擎和對應(yīng)的采集信息;
創(chuàng)建模塊,用于創(chuàng)建所述采集引擎,并控制所述采集引擎根據(jù)對應(yīng)的采集信息對對應(yīng)的資源進行采集;
其中,所述采集引擎包括:網(wǎng)頁采集引擎,相應(yīng)的,所述網(wǎng)頁采集引擎對應(yīng)的采集信息為網(wǎng)頁資源采集信息;
控制模塊,用于控制所述采集引擎按照預(yù)設(shè)策略將所述采集的對應(yīng)的資源存入到資源庫中。
本發(fā)明實施例提供一種資源庫中的資源采集方法和裝置,通過配置至少一種采集引擎和對應(yīng)的采集信息;創(chuàng)建采集引擎,并控制采集引擎根據(jù)對應(yīng)的采集信息對資源進行采集;其中,采集引擎包括:網(wǎng)頁采集引擎,相應(yīng)的,網(wǎng)頁采集引擎對應(yīng)的采集信息為網(wǎng)頁資源采集信息;控制采集引擎按照預(yù)設(shè)策略將采集的對應(yīng)的資源存入到資源庫中。由于采集的資源包括了網(wǎng)頁資源,極大的豐富了資源庫中的資源,使資源庫中的資源多樣化,能夠使資源庫在實際應(yīng)用中滿足需求。
附圖說明
為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明資源庫中的資源采集方法實施例一的流程圖;
圖2為本發(fā)明資源庫中的資源采集方法實施例二的流程圖;
圖3為本發(fā)明資源庫中的資源采集裝置實施例一的結(jié)構(gòu)示意圖;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北大方正集團有限公司;北京北大方正電子有限公司,未經(jīng)北大方正集團有限公司;北京北大方正電子有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611032326.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





