[發明專利]網頁快照的生成方法及裝置有效
| 申請號: | 201610104459.5 | 申請日: | 2016-02-25 |
| 公開(公告)號: | CN105787032B | 公開(公告)日: | 2019-03-29 |
| 發明(設計)人: | 熊正祥 | 申請(專利權)人: | 廣州神馬移動信息科技有限公司 |
| 主分類號: | G06F16/958 | 分類號: | G06F16/958 |
| 代理公司: | 北京超凡志成知識產權代理事務所(普通合伙) 11371 | 代理人: | 吳開磊 |
| 地址: | 510627 廣東省廣州市天河區黃埔大*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 網頁快照 生成 方法 裝置 | ||
本發明公開了一種網頁快照的生成方法及裝置,所述方法包括:在按照關鍵字搜索到網頁資源之后,獲取所述網頁資源對應的網頁內容;從所述網頁內容所包含的所述關鍵字中篩選未添加鏈接的關鍵字;按照預設規則為所述未添加鏈接的關鍵字添加鏈接,得到所述網頁資源對應的網頁快照。本發明還提供了一種網頁快照的生成裝置。本發明的技術方案,在網頁內容中增加鏈接資源入口的同時,還能夠保證添加鏈接后網頁內容對應的程序結構和格式正確,確保程序的正常運行和網頁內容顯示時排版正確,從而能夠大大的提高用戶體驗。
技術領域
本發明涉及互聯網技術領域,更具體而言,涉及一種網頁快照的生成方法及裝置。
背景技術
為了能夠及時、快速的查看所搜索的網頁內容,搜索引擎根據用戶輸入的搜索信息搜索到網頁資源之后,通常將網頁資源對應的內容進行抓取,并處理成純文本的網頁內容,然后,將處理后得到的純文本網頁內容存儲到搜索引擎的緩存中。相關技術中,將所緩存的純文本網頁內容稱為網頁快照。當網速不穩定或者搜索到的網頁資源發生變化,導致無法正常打開搜索到的網頁資源時,用戶可以通過網頁快照訪問所緩存的純文本網頁內容。
需要說明的是,為了提高搜索到的網頁資源的定向匹配精確度,提高搜索效率,搜索引擎在接收用戶輸入的搜索信息之后,可以首先從搜索信息中提取出最能概括用戶查找內容的關鍵字,并將所提取的關鍵字作為主要索引信息進行網頁資源搜索。由于關鍵字是搜索信息的概括化和集中化查詢詞,因此,為了增加鏈接的資源入口,相關技術中,可以為網頁快照中所包含的所有關鍵字添加相應超鏈接,以便于用戶能夠通過網頁快照中的任意關鍵字訪問其他相關資源。
然而,由于網頁快照對應的網頁內容包含已添加超鏈接的語句和詞匯,而已添加超鏈接的語句和詞匯中可能包含關鍵字,而且,搜索引擎在生成網頁快照時,通常僅將網頁資源對應的內容處理成純文本網頁內容,對網頁內容中的超鏈接不進行處理,因此,如果為所有關鍵字添加超鏈接,網頁快照中將存在部分添加有兩次超鏈接的關鍵字,不僅會造成程序結構和格式的混亂,導致程序運行時易產生錯誤,而且還會造成網頁快照在顯示時排版錯亂,導致用戶體驗不好。
發明內容
有鑒于此,本發明實施例提供了一種網頁快照的生成方法及裝置,能夠解決相關技術中存在的程序運行易產生錯誤,且網頁快照在顯示時排版錯亂的問題。
第一方面,本發明實施例提供了一種網頁快照的生成方法,包括:在按照關鍵字搜索到網頁資源之后,獲取所述網頁資源對應的網頁內容;從所述網頁內容所包含的所述關鍵字中篩選未添加鏈接的關鍵字;按照預設規則為所述未添加鏈接的關鍵字添加鏈接,得到所述網頁資源對應的網頁快照。
在第一方面的第一種可能的實現方式中,所述從所述網頁內容所包含的所述關鍵字中篩選未添加鏈接的關鍵字,包括:獲取所述網頁內容中已添加鏈接的文本的區域標識和所述關鍵字的區域標識;根據所述區域標識將區域不屬于所述已添加鏈接的文本區域的關鍵字確定為未添加鏈接的關鍵字。
結合上述第一方面,在第二種可能的實現方式中,所述獲取所述網頁內容中已添加鏈接的文本的區域標識,包括:從所述網頁內容的源代碼中順次選擇符合第一預設規則的每組第一起始字符和第一結束字符;分別記錄所述每組第一起始字符和第一結束字符在所述源代碼中對應的順序號,作為每段所述已添加鏈接的文本的區域標識。
結合上述第一方面,在第三種可能的實現方式中,所述獲取所述網頁內容中所述關鍵字的區域標識,包括:從所述網頁內容的源代碼中順次選擇符合第二預設規則的每組第二起始字符和第二結束字符;分別記錄所述每組第二起始字符和第二結束字符在所述源代碼中對應的順序號,作為每組所述關鍵字的區域標識。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州神馬移動信息科技有限公司,未經廣州神馬移動信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610104459.5/2.html,轉載請聲明來源鉆瓜專利網。





