[發明專利]電子書更新章節的調度方法和裝置有效
| 申請號: | 201510977669.0 | 申請日: | 2015-12-23 |
| 公開(公告)號: | CN105630942B | 公開(公告)日: | 2019-05-21 |
| 發明(設計)人: | 鄺景勝 | 申請(專利權)人: | 北京奇虎科技有限公司;奇智軟件(北京)有限公司 |
| 主分類號: | G06F16/955 | 分類號: | G06F16/955 |
| 代理公司: | 北京市立方律師事務所 11330 | 代理人: | 王增鑫 |
| 地址: | 100088 北京市西城區新*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 電子書 更新 章節 調度 方法 裝置 | ||
1.一種電子書更新章節的調度方法,其特征在于,包括:
針對電子書相關站點內新增的統一資源定位符URL,根據所述URL所屬站點的URL模式Pattern詞典,確定出所述URL的Pattern;
根據所述URL的Pattern,從預設的電子書模式信息庫中反向識別出所述URL所對應的電子書;并將識別出的電子書確定為已更新的電子書;
在所述URL所屬站點內對已更新的電子書的章節列表頁發起調度,從中抓取已更新的電子書的所有更新章節。
2.如權利要求1所述的方法,其特征在于,站點的URL Pattern詞典通過如下方法預先建立:
對于每個電子書相關站點,預先收集屬于該站點的設定數量的URL;
根據URL的片段結構,將收集的URL進行分組;其中,同一分組內的URL共有同一種片段結構;
針對每個分組,將該分組內的URL所共有的片段結構識別為該站點的一個Pattern;
將識別出的該站點的各個Pattern,添加到該站點的URL Pattern詞典中。
3.如權利要求2所述的方法,其特征在于,電子書模式信息庫通過如下方法預先設置:
對于每個電子書相關站點,預先收集該站點當前包含的所有電子書;
根據該站點的URL Pattern詞典,確定電子書的各章節內容頁的URL的Pattern,并由此統計出電子書所涉及的Pattern;
將各章節內容頁的URL的Pattern之間的公共部分作為電子書在該站點的ID;
針對電子書所涉及的每個Pattern,確定出所述ID在該Pattern中所處的位置,并作為該Pattern的公共部分位置;
根據電子書所涉及的Pattern、Pattern的公共部分位置、電子書在站點的ID,建立倒排索引后存儲于所述電子書模式信息庫中。
4.如權利要求3所述的方法,其特征在于,所述根據所述URL的Pattern,從預設的電子書模式信息庫中反向識別出所述URL所對應的電子書,具體包括:
從預設的電子書模式信息庫中查找出所述URL的Pattern所對應的公共部分位置;
將所述URL中處于所述公共部分位置的內容提取為所述URL的身份標識碼ID;
將所述電子書模式信息庫中與所述ID對應的電子書識別為所述URL所對應的電子書。
5.如權利要求1-4任一所述的方法,其特征在于,電子書相關站點內新增的URL是預先識別出的:
按照預設的調度周期,獲取電子書相關站點的活性索引頁;
針對所述活性索引頁中的每個URL,查詢該URL是否屬于現有鏈接庫;若否,則將該URL識別為新增的URL;
其中,所述現有鏈接庫中存儲有本次調度之前電子書相關站點包含的所有URL。
6.如權利要求5所述的方法,其特征在于,所述現有鏈接庫采用布隆過濾器BloomFilter算法存儲電子書相關站點包含的所有URL。
7.如權利要求6所述的方法,其特征在于,所述針對所述活性索引頁中的每個URL,查詢該URL是否屬于現有鏈接庫,具體包括:
針對所述活性索引頁中的每個URL,通過所述Bloom Filter算法查詢該URL是否屬于所述現有鏈接庫。
8.一種電子書更新章節的調度裝置,其特征在于,包括:
URL模式確定模塊,用于針對電子書相關站點內新增的URL,根據所述URL所屬站點的URL Pattern詞典,確定出所述URL的Pattern;
更新電子書識別模塊,用于根據所述URL的Pattern,從預設的電子書模式信息庫中反向識別出所述URL所對應的電子書;并將識別出的電子書確定為已更新的電子書;
更新章節調度模塊,用于針對所述更新電子書識別模塊識別出的已更新的電子書,在所述URL所屬站點內對該電子書的章節列表發起調度,從中抓取該電子書的所有更新章節。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京奇虎科技有限公司;奇智軟件(北京)有限公司,未經北京奇虎科技有限公司;奇智軟件(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510977669.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種汽車發動機缸體油道的密封方法
- 下一篇:油霧探測器





