[發明專利]網站頁面在搜索引擎中收錄數量的檢測方法和裝置有效
| 申請號: | 201410730102.9 | 申請日: | 2014-12-03 |
| 公開(公告)號: | CN104408156B | 公開(公告)日: | 2017-12-22 |
| 發明(設計)人: | 姜世豪;楊韜;王曉群;譚紫萱 | 申請(專利權)人: | 北京國雙科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京康信知識產權代理有限責任公司11240 | 代理人: | 李志剛,吳貴明 |
| 地址: | 100086 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 網站 頁面 搜索引擎 收錄 數量 檢測 方法 裝置 | ||
技術領域
本發明涉及互聯網領域,具體而言,涉及一種網站頁面在搜索引擎中收錄數量的檢測方法和裝置。
背景技術
隨著互聯網搜索技術的發展,由搜索引擎帶來的訪問流量占據著網站訪問流量的主要比例。搜索引擎來源的流量分為付費搜索流量和自然搜索(即非付費搜索)流量。其中付費搜索的投放需要一定的資金成本,而自然搜索帶來的流量是免費的、高質量的、穩定的。因此,越來越多的站長(廣告主)關注自己網站在自然搜索的表現。
自然搜索的表現即自然搜索流量的大小是由自然搜索結果的排名直接決定的。要想提高網站在自然搜索結果中的排名表現,首先需要優化網站的結構,讓搜索引擎通過爬蟲能夠抓取到網站盡可能多的頁面,以提高網站在搜索引擎中的收錄數量,再對頁面去做關鍵詞部署優化,進而提高網站在自然搜索結果中的排名。因此,搜索引擎收錄數量的提升,是優化網站的前提和基礎。
提高網站在搜索引擎中的收錄數量,可以通過采用適應搜索引擎爬蟲算法的方式去優化網頁代碼以及調整網站的層級結構等方法實現。在不斷的適應和調整過程中,網站的收錄數量會隨之變化,同時,由于搜索引擎的算法也會有持續的調整,因此網站主需要關注網站在搜索引擎中的收錄數量,來衡量自身網站的優化效果。準確掌握搜索引擎收錄量的數據變化是至關重要的,為此,搜索引擎提供了一種通過輸入搜索代碼來查詢網站收錄數量的方法。該方法是通過在搜索引擎搜索框中輸入查詢命令,搜索引擎從服務器中檢索并返回數值來實現的。但是,搜索引擎將網站已經收錄的網絡地址采用分布式存儲的方式存儲在不同的服務器上,并將各服務器返回的數值相加作為最終結果。受限于網絡因素,往往并不能得到所有服務器的響應,以至于最終查詢結果在不同時間、不同網絡環境下差異極大,影響到對網站收錄數量的準確評估。
針對現有技術對網站頁面在搜索引擎中的收錄數量的查詢結果不準確的問題,目前尚未提出有效的解決方案。
發明內容
本發明的主要目的在于提供一種網站頁面在搜索引擎中收錄數量的檢測方法和裝置,以解決現有技術對網站頁面在搜索引擎中的收錄數量的查詢結果不準確的問題。
為了實現上述目的,根據本發明的一個方面,提供了一種網站頁面在搜索引擎中收錄數量的檢測方法。
該網站頁面在搜索引擎中收錄數量的檢測方法包括:獲取待檢測網站的所有頁面的網絡地址;從待檢測網站的所有頁面的網絡地址中確定待查詢網絡地址;獲取包含待查詢網絡地址的網絡地址;遍歷包含待查詢網絡地址的網絡地址,檢測包含待查詢網絡地址的網絡地址對應的頁面是否被搜索引擎收錄;如果檢測到包含待查詢網絡地址的網絡地址對應的頁面被搜索引擎收錄,將待查詢網絡地址對應的網頁在搜索引擎中的收錄數量進行累加。
進一步地,在獲取待檢測網站的所有頁面的網絡地址之后,該網站頁面在搜索引擎中收錄數量的檢測方法還包括:檢測是否已經成功獲取待檢測網站的所有頁面的網絡地址;如果檢測到已經成功獲取待檢測網站的所有頁面的網絡地址,將待檢測網站的所有頁面的網絡地址存入待檢測網站的頁面網絡地址列表中。
進一步地,待查詢網絡地址為以下任意一類或者多類網絡地址:第一類別網絡地址,第一類別網絡地址為待檢測網站的首頁的網絡地址;第二類別網絡地址,第二類別網絡地址為待檢測網站的二級域名網絡地址;第三類別網絡地址,第三類別網絡地址為待檢測網站的所有頁面的網絡地址中除第一類別網絡地址和第二類別網絡地址之外的網絡地址。
進一步地,檢測包含待查詢網絡地址的網絡地址對應的頁面是否被搜索引擎收錄包括:判斷待查詢網絡地址是否是第一類別網絡地址;如果判斷出待查詢網絡地址是第一類別網絡地址,遍歷待檢測網站的所有頁面;檢測待檢測網站的所有頁面是否被搜索引擎收錄;如果判斷出待查詢網絡地址不是第一類別網絡地址,判斷待查詢網絡地址是否是第二類別網絡地址;如果判斷出待查詢網絡地址是第二類別網絡地址,遍歷待檢測網站的所有二級域名網絡地址對應的頁面;檢測待檢測網站的所有二級域名網絡地址對應的頁面是否被搜索引擎收錄;如果判斷出待查詢網絡地址不是第二類別網絡地址,遍歷待檢測網站的所有頁面的網絡地址中除第一類別網絡地址和第二類別網絡地址之外的網絡地址對應的頁面;檢測待檢測網站的所有頁面的網絡地址中除第一類別網絡地址和第二類別網絡地址之外的網絡地址對應的頁面是否被搜索引擎收錄。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京國雙科技有限公司,未經北京國雙科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410730102.9/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種可拆卸的標槍
- 下一篇:一種新型折疊式籃球架





