[發(fā)明專利]電子書更新章節(jié)的調度方法和裝置有效
| 申請?zhí)枺?/td> | 201510977669.0 | 申請日: | 2015-12-23 |
| 公開(公告)號: | CN105630942B | 公開(公告)日: | 2019-05-21 |
| 發(fā)明(設計)人: | 鄺景勝 | 申請(專利權)人: | 北京奇虎科技有限公司;奇智軟件(北京)有限公司 |
| 主分類號: | G06F16/955 | 分類號: | G06F16/955 |
| 代理公司: | 北京市立方律師事務所 11330 | 代理人: | 王增鑫 |
| 地址: | 100088 北京市西城區(qū)新*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 電子書 更新 章節(jié) 調度 方法 裝置 | ||
本發(fā)明提供了一種電子書更新章節(jié)的調度方法和裝置,該方法包括:針對電子書相關站點內新增的統(tǒng)一資源定位符URL,根據(jù)所述URL所屬站點的URL模式Pattern詞典,確定出所述URL的Pattern;根據(jù)所述URL的Pattern,從預設的電子書模式信息庫中反向識別出所述URL所對應的電子書;并將識別出的電子書確定為已更新的電子書;在所述URL所屬站點內對已更新的電子書的章節(jié)列表頁發(fā)起調度,從中抓取已更新的電子書的所有更新章節(jié)。應用本發(fā)明,能夠快速識別已更新的電子書,提高更新章節(jié)的抓取速度;而且無需頻繁地進行抓取操作,提高了更新章節(jié)的抓取效率。
技術領域
本發(fā)明涉及電子書技術領域,具體而言,本發(fā)明涉及一種電子書更新章節(jié)的調度方法和裝置。
背景技術
近幾年來,網絡上追書成為了一種時尚,追書的用戶都希望在第一時間看到連載電子書(比如,小說)更新的內容。因此,電子書更新章節(jié)的時效性需求極為緊迫。
若能準確了解電子書的更新時間點,將可以快速抓取電子書更新章節(jié)。然而,作者對于一本電子書的更新帶有一定的隨機性,電子書的更新時間點難以預測。
目前,現(xiàn)有可以針對目標電子書,不斷抓取各電子書相關站點中該目標電子書的章節(jié)列表頁,將當前抓取的章節(jié)列表頁與之前抓取的章節(jié)列表頁進行比對,由此確定出已更新的章節(jié)列表頁,繼而,根據(jù)已更新的章節(jié)列表頁抓取目標電子書的更新章節(jié)。
采用現(xiàn)有的方案來抓取電子書更新章節(jié),雖然無需預測電子書的更新時間點,但需要在各個站點對電子書的章節(jié)列表頁進行頻繁的抓取操作,存在抓取量大;而且,事實上,在電子書未發(fā)生更新的情況下,將會存在大量的無效抓取操作,由此造成更新章節(jié)的抓取效率低。
發(fā)明內容
針對上述現(xiàn)有技術存在的缺陷,本發(fā)明提供了一種電子書更新章節(jié)的調度方法和裝置,能夠快速識別已更新的電子書,提高更新章節(jié)的抓取速度;而且無需頻繁地進行抓取操作,提高了更新章節(jié)的抓取效率。
本發(fā)明提供了電子書更新章節(jié)的調度方法,其特征在于,包括:
針對電子書相關站點內新增的統(tǒng)一資源定位符URL,根據(jù)所述URL所屬站點的URL模式Pattern詞典,確定出所述URL的Pattern;
根據(jù)所述URL的Pattern,從預設的電子書模式信息庫中反向識別出所述URL所對應的電子書;并將識別出的電子書確定為已更新的電子書;
在所述URL所屬站點內對已更新的電子書的章節(jié)列表頁發(fā)起調度,從中抓取已更新的電子書的所有更新章節(jié)。
較佳地,站點的URL Pattern詞典通過如下方法預先建立:
對于每個電子書相關站點,預先收集屬于該站點的設定數(shù)量的URL;
根據(jù)URL的片段結構,將收集的URL進行分組;其中,同一分組內的URL共有同一種片段結構;
針對每個分組,將該分組內的URL所共有的片段結構識別為該站點的一個Pattern;
將識別出的該站點的各個Pattern,添加到該站點的URL Pattern詞典中。
較佳地,電子書模式信息庫通過如下方法預先設置:
對于每個電子書相關站點,預先收集該站點當前包含的所有電子書;
根據(jù)該站點的URL Pattern詞典,確定電子書的各章節(jié)內容頁的URL的Pattern,并由此統(tǒng)計出電子書所涉及的Pattern;
將各章節(jié)內容頁的URL的Pattern之間的公共部分作為電子書在該站點的ID;
針對電子書所涉及的每個Pattern,確定出所述ID在該Pattern中所處的位置,并作為該Pattern的公共部分位置;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京奇虎科技有限公司;奇智軟件(北京)有限公司,未經北京奇虎科技有限公司;奇智軟件(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510977669.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種汽車發(fā)動機缸體油道的密封方法
- 下一篇:油霧探測器





