[發明專利]一種識別網頁相關資源類型的方法及裝置無效
| 申請號: | 200810247580.9 | 申請日: | 2008-12-30 |
| 公開(公告)號: | CN101615184A | 公開(公告)日: | 2009-12-30 |
| 發明(設計)人: | 萬勇 | 申請(專利權)人: | 北京搜狗科技發展有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京集佳知識產權代理有限公司 | 代理人: | 逯長明 |
| 地址: | 100084北京市海淀區中關*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 識別 網頁 相關 資源類型 方法 裝置 | ||
技術領域
本發明涉及瀏覽器技術領域,特別是涉及一種識別網頁相關資源類型的方法及裝置。
背景技術
隨著多媒體技術的發展,一方面,人們可以通過瀏覽器查看到互聯網上各種各樣豐富多彩的信息資源,這些資源通常有文字、視頻、音頻、圖片等多種類型,各種類型的資源可以給人們的視覺或聽覺帶來多種不同的感受,豐富著人們的精神生活;另一方面,用戶對瀏覽器的智能化要求也越來越高。
例如,某網頁上提供了一些視頻資源,用戶總是會想將這些視頻下載到本地進行觀看,但是視頻的下載地址并不會顯示在網頁上,因此就會希望瀏覽器能夠具有提供指定視頻下載地址的功能。而該網頁中可能同時存在其它各種類型的資源,此時,瀏覽器就需要對網頁中的資源按照類型進行過濾,找到其中的視頻資源及其下載地址,進而提供給用戶。
又如,對于網頁中的視頻,通常只能在該網頁中內嵌該視頻的位置直接為用戶播放該視頻,而用戶可能希望這段視頻能夠置頂播放,并且可以按照自己的需求改變視頻窗口的位置,等等。此時,瀏覽器可能需要提取網頁中的特定資源,進而改變資源在原網頁中的展現形式,以滿足用戶的需求。
但是,無論是對網頁中的資源按照類型進行過濾還是提取網頁中的特定資源,都需要首先識別出網頁中資源的類型。因此如何能準確有效地識別出網頁中資源的類型是非常關鍵的。由于瀏覽器在加載網頁時,會首先向服務器發送加載某資源的請求信息,該請求信息中會包括該資源的URL,而資源URL的后綴通常會體現出資源的類型,因此,現有技術通常通過截獲所述請求信息來識別網頁中資源的類型。例如,發現某請求信息中資源的URL后綴為jpg,則識別出該資源為圖片資源。
但是,實際上瀏覽器在發送請求信息時,資源URL的后綴可以是任意的,這樣并不會影響客戶端的效果,例如,圖片的后綴通常為jpg,但是如果請求信息中資源URL的后綴名是123,客戶端仍然能夠成功加載該圖片資源,然而,當通過請求信息中資源的URL的后綴來識別資源時,將會無法識別出該圖片資源。而且,如果,請求信息中將圖片資源URL的后綴名為FLV,則該現有技術會將該資源識別為視頻資源。可見,該現有技術識別出的資源的類型很可能是不準確的。
發明內容
有鑒于此,本發明的目的在于提供一種識別網頁特定資源類型的方法及裝置,以解決現有技術可能無法準確地識別出網頁相關資源類型的問題。
為實現上述目的,本發明提供了如下方案:
一種識別網頁相關資源類型的方法,包括:
截獲服務器針對下載網頁相關資源的請求信息返回的響應信息;
提取所述響應信息攜帶的數據內容中包含的網頁相關資源的特征信息;
根據所述特征信息識別網頁相關資源的類型。
優選的,所述數據內容中包含的網頁相關資源的特征信息包括:
所述數據內容的二進制文件流中前預置數目字節中的內容。
優選的,所述網頁相關資源包括:
所述網頁中的資源;
和/或,
所述網頁的子頁面中的資源;
和/或,
所述網頁后臺傳輸的資源;
和/或,
所述網頁中超鏈接指向的網頁中的資源;
和/或,
與所述網頁具有相同主題的網頁中的資源。
優選的,所述網頁相關資源的類型包括視頻資源、音頻資源、圖片資源、動畫以及文本資源中的任意一種或任意多種組合。
優選的,所述網頁相關資源為不需要使用網頁嵌入的播放器播放的資源時,所述截獲服務器針對下載網頁相關資源的請求信息返回的響應信息包括:
截獲服務器向瀏覽器返回的響應信息。
優選的,所述網頁相關資源為在網頁嵌入的播放器中播放的資源時,所述截獲服務器針對下載網頁相關資源的請求信息返回的響應信息包括:
截獲服務器向所述網頁嵌入的播放器返回的響應信息。
一種識別網頁相關資源類型的裝置,包括:
響應信息截獲單元,用于截獲服務器針對下載網頁相關資源的請求信息返回的響應信息;
特征信息提取單元,用于提取所述響應信息攜帶的數據內容中包含的網頁相關資源的特征信息;
資源類型識別單元,用于根據所述特征信息識別網頁相關資源的類型。
優選的,所述數據內容中包含的網頁相關資源的特征信息包括:
所述數據內容的二進制文件流中前預置數目字節中的內容。
優選的,所述網頁相關資源包括:
所述網頁中的資源;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京搜狗科技發展有限公司,未經北京搜狗科技發展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200810247580.9/2.html,轉載請聲明來源鉆瓜專利網。





