[發明專利]網頁快照的生成方法及裝置有效
| 申請號: | 201610104459.5 | 申請日: | 2016-02-25 |
| 公開(公告)號: | CN105787032B | 公開(公告)日: | 2019-03-29 |
| 發明(設計)人: | 熊正祥 | 申請(專利權)人: | 廣州神馬移動信息科技有限公司 |
| 主分類號: | G06F16/958 | 分類號: | G06F16/958 |
| 代理公司: | 北京超凡志成知識產權代理事務所(普通合伙) 11371 | 代理人: | 吳開磊 |
| 地址: | 510627 廣東省廣州市天河區黃埔大*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 網頁快照 生成 方法 裝置 | ||
1.一種網頁快照的生成方法,其特征在于,包括:
在按照關鍵字搜索到網頁資源之后,獲取所述網頁資源對應的網頁內容;
從所述網頁內容所包含的所述關鍵字中篩選未添加鏈接的關鍵字;
按照預設規則為所述未添加鏈接的關鍵字添加鏈接,得到所述網頁資源對應的網頁快照。
2.如權利要求1所述的網頁快照的生成方法,其特征在于,所述從所述網頁內容所包含的所述關鍵字中篩選未添加鏈接的關鍵字,包括:
獲取所述網頁內容中已添加鏈接的文本的區域標識和所述關鍵字的區域標識;
根據所述區域標識將區域不屬于所述已添加鏈接的文本區域的關鍵字確定為未添加鏈接的關鍵字。
3.如權利要求2所述的網頁快照的生成方法,其特征在于,所述獲取所述網頁內容中已添加鏈接的文本的區域標識,包括:
從所述網頁內容的源代碼中順次選擇符合第一預設規則的每組第一起始字符和第一結束字符;
分別記錄所述每組第一起始字符和第一結束字符在所述源代碼中對應的順序號,作為每段所述已添加鏈接的文本的區域標識。
4.如權利要求2所述的網頁快照的生成方法,其特征在于,所述獲取所述網頁內容中所述關鍵字的區域標識,包括:
從所述網頁內容的源代碼中順次選擇符合第二預設規則的每組第二起始字符和第二結束字符;
分別記錄所述每組第二起始字符和第二結束字符在所述源代碼中對應的順序號,作為每組所述關鍵字的區域標識。
5.如權利要求2至4中任一項所述的網頁快照的生成方法,其特征在于,所述根據所述區域標識將區域不屬于所述已添加鏈接的文本區域的關鍵字確定為未添加鏈接的關鍵字,包括:
確定順序號小于第二起始字符順序號的第一起始字符中最大的第一起始字符順序號;
判斷所述第一起始字符對應的第一結束字符的順序號是否小于所述第二起始字符的順序號;
當所述第一起始字符對應的第一結束字符的順序號小于所述第二起始字符的順序號,將所述第二起始字符對應的關鍵字確定為所述未添加鏈接的關鍵字;或者,
確定順序號大于第二結束字符順序號的第一結束字符中最小的第一結束字符順序號;
判斷所述第一結束字符對應的第一起始字符的順序號是否大于所述第二結束字符的順序號;
當所述第一結束字符對應的第一起始字符的順序號大于所述第二結束字符的順序號時,將所述第二結束字符對應的關鍵字確定為所述未添加鏈接的關鍵字。
6.一種網頁快照的生成裝置,其特征在于,包括:
獲取模塊,用于在按照關鍵字搜索到網頁資源之后,獲取所述網頁資源對應的網頁內容;
篩選模塊,用于從所述網頁內容所包含的所述關鍵字中篩選未添加鏈接的關鍵字;
添加模塊,用于按照預設規則為所述未添加鏈接的關鍵字添加鏈接,得到所述網頁資源對應的網頁快照。
7.如權利要求6所述的網頁快照的生成裝置,其特征在于,所述篩選模塊包括獲取單元和確定單元,其中,
所述獲取單元,用于獲取所述網頁內容中已添加鏈接的文本的區域標識和所述關鍵字的區域標識;
所述確定單元,用于根據所述區域標識將區域不屬于所述已添加鏈接的文本區域的關鍵字確定為未添加鏈接的關鍵字。
8.如權利要求7所述的網頁快照的生成裝置,其特征在于,所述獲取單元包括選擇子單元和記錄子單元,其中,
所述選擇子單元,用于從所述網頁內容的源代碼中順次選擇符合第一預設規則的每組第一起始字符和第一結束字符;
所述記錄子單元,用于分別記錄所述每組第一起始字符和第一結束字符在所述源代碼中對應的順序號,作為每段所述已添加鏈接的文本的區域標識。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州神馬移動信息科技有限公司,未經廣州神馬移動信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610104459.5/1.html,轉載請聲明來源鉆瓜專利網。





