[發明專利]展現和獲取下載鏈接的方法及裝置在審
| 申請號: | 201210191877.4 | 申請日: | 2012-06-11 |
| 公開(公告)號: | CN102760162A | 公開(公告)日: | 2012-10-31 |
| 發明(設計)人: | 田偉;應倩;蘇雪峰;佟子健;茹立云 | 申請(專利權)人: | 北京搜狗信息服務有限公司;北京搜狗科技發展有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司 11319 | 代理人: | 蘇培華 |
| 地址: | 100084 北京市海淀區中關*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 展現 獲取 下載 鏈接 方法 裝置 | ||
1.一種獲取下載鏈接的方法,其特征在于,包括:
依據當前瀏覽頁面的頁面信息,判定當前瀏覽頁面是否為下載相關頁面;
在當前瀏覽頁面為下載相關頁面時,依據所述下載相關頁面的頁面信息獲取當前瀏覽頁面相應資源的下載鏈接;
對所述下載鏈接進行分析優選,得到對應的優選下載鏈接;
將所述優選下載鏈接進行返回。
2.如權利要求1所述的方法,其特征在于,所述依據當前瀏覽頁面的頁面信息,判定當前瀏覽頁面是否為下載相關頁面的步驟,包括:
將所述當前瀏覽頁面的頁面信息與預存的下載站點內下載相關頁面的頁面信息進行匹配,若匹配成功,則判定當前瀏覽頁面為下載相關頁面;和/或
依據頁面模型判別所述當前瀏覽頁面是否為下載類別,若為下載類別,則判定當前瀏覽頁面為下載相關頁面;所述頁面模型依據全網中抓取的頁面元素和用戶標識進行構造,用于判定當前瀏覽頁面所屬的類別。
3.如權利要求1所述的方法,其特征在于,所述依據所述下載相關頁面的頁面信息獲取相應資源的下載鏈接的步驟,包括:
提取所述下載相關頁面中的位置信息,并依據所述位置信息分析出對應的下載鏈接;和/或
根據預設的下載相關頁面信息和下載鏈接的對應關系,由所述下載相關頁面的頁面信息匹配得到相應資源的下載鏈接。
4.如權利要求3所述的方法,其特征在于,所述提取所述下載相關頁面中的位置信息,并依據所述位置信息分析出對應的下載鏈接的步驟,進一步包括:
所述下載相關頁面含有所述下載鏈接時,所述依據所述頁面信息進行分析,得到相應資源的下載鏈接在所述下載相關頁面中的位置信息作為第一位置信息,并依據所述第一位置信息提取所述下載鏈接;
所述下載相關頁面不含所述下載鏈接時,所述依據所述頁面信息轉至含有相應資源的下載鏈接所在的二級下載頁面進行分析,得到相應資源的下載鏈接在所述二級下載頁面中的位置信息作為第二位置信息,并依據所述第二位置信息提取所述下載鏈接。
5.如權利要求4所述的方法,其特征在于,所述依據所述頁面信息進行分析,得到相應資源的下載鏈接在所述下載相關頁面中的位置信息作為第一位置信息的步驟,包括:
依據所述下載相關頁面的頁面信息進行分析,得到所述下載相關頁面的站點屬性;
根據預存的各站點屬性與該站點內所述下載相關頁面中下載鏈接所對應的位置信息的關聯關系,匹配得到所述下載鏈接在所述下載相關頁面中的位置信息作為第一位置信息。
6.如權利要求4或5所述的方法,其特征在于,所述下載相關頁面含有所述下載鏈接時,所述方法還包括:
分別提取同一下載站點內各下載相關頁面中的鏈接和所述鏈接在各下載相關頁面中的相對位置,并分別統計下載相關頁面中的各相對位置所對應的不同鏈接的數目;
將在所述不同鏈接的數目最大時所對應的相對位置作為第一位置信息。
7.如權利要求4所述的方法,其特征在于,所述依據所述頁面信息轉至含有相應資源的下載鏈接所在的二級下載頁面進行分析,得到相應資源的下載鏈接在所述二級下載頁面中的位置信息作為第二位置信息的步驟,包括:
依據所述頁面信息得到含有相應資源的下載鏈接所在的頁面的站點屬性;
根據預存的各站點屬性與該站點內二級下載頁面中下載鏈接所對應的位置信息的關聯關系,匹配得到相應資源的下載鏈接在所述二級下載頁面中的位置信息,作為第二位置信息。
8.如權利要求4或7所述的方法,其特征在于,所述下載相關頁面不含所述下載鏈接時,所述方法還包括:
分別提取同一下載站點內各二級下載頁面中的鏈接和所述鏈接在各二級下載頁面中的相對位置,并分別統計二級下載頁面中的各相對位置所對應的不同鏈接的數目;
將在所述不同鏈接的數目最大時所對應的相對位置作為第二位置信息。
9.如權利要求1所述的方法,其特征在于,所述對下載鏈接進行分析優選,得到對應的優選下載鏈接的步驟,進一步包括:
在所述下載鏈接為一個以上時,根據各下載鏈接的質量屬性,確定各下載鏈接的質量;
依據下載鏈接的質量,從所述下載鏈接中選擇優選的下載鏈接作為優選下載鏈接。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京搜狗信息服務有限公司;北京搜狗科技發展有限公司,未經北京搜狗信息服務有限公司;北京搜狗科技發展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210191877.4/1.html,轉載請聲明來源鉆瓜專利網。





