[發明專利]一種識別緩存文件的方法及裝置有效
| 申請號: | 201310308214.0 | 申請日: | 2013-07-22 |
| 公開(公告)號: | CN103347092A | 公開(公告)日: | 2013-10-09 |
| 發明(設計)人: | 白宇 | 申請(專利權)人: | 星云融創(北京)信息技術有限公司 |
| 主分類號: | H04L29/08 | 分類號: | H04L29/08 |
| 代理公司: | 北京思睿峰知識產權代理有限公司 11396 | 代理人: | 趙愛軍 |
| 地址: | 100080 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 識別 緩存 文件 方法 裝置 | ||
技術領域
本發明涉及互聯網領域,特別涉及一種識別緩存文件的方法及裝置。
背景技術
web代理網關可以通過緩存網站靜態文件(資源)來達到對網站進行加速的目的,傳統的web代理網關一般是通過文件名后綴來識別文件類型,并根據識別出的文件類型來確定是否要對文件進行緩存,如ajpg、b.png被識別為圖片文件,為可緩存文件。
但是,網站出于對內容的保護,有時候會去掉文件的文件名后綴進行傳輸,傳統的web代理網關就不能對此類文件進行緩存加速。另外,有些網站出于某些目的(或者出錯),實際傳輸的文件內容并不是文件名后綴標識的文件類型,這種情況傳統的web代理就有可能會對不應該緩存的文件進行緩存,而導致違背源站的目的。
可見,傳統的web代理網關通過文件后綴進行判斷是否需要對文件進行緩存,而沒有文件名后綴的可以緩存資源就會被遺漏,同時當文件名后綴標識的文件類型和文件內容不相符的時候也不能進行驗證。
發明內容
有鑒于此,本發明的目的是提供一種識別緩存文件的方法及裝置,以提高對傳輸的數據文件的文件類型識別的準確性,進而提高對文件進行緩存的準確性。
為實現上述目的,本發明提供技術方案如下:
一種識別緩存文件的方法,應用于web代理網關中,所述方法包括:
A、根據文件名后綴和/或http頭中的Content-Type字段內容,對http數據中承載的數據文件的文件類型進行初步識別,當通過所述初步識別得到了所述數據文件的文件類型時,進入步驟B,當通過所述初步識別未能得到所述數據文件的文件類型時,進入步驟C;
B、根據所述數據文件的文件頭部對所述初步識別得到的文件類型進行驗證,當驗證結果正確時,將所述初步識別得到的文件類型確定為真正文件類型,進入步驟D,當驗證結果錯誤時,進入步驟C;
C、根據所述數據文件的文件頭部確定所述數據文件的真正文件類型;
D、根據所述數據文件的真正文件類型確定所述數據文件是否為可緩存文件。
上述的方法,步驟B中,根據所述數據文件的文件頭部對所述初步識別得到的文件類型進行驗證,具體包括:
將所述數據文件的文件頭部與所述初步識別得到的文件類型的內容特征進行匹配,匹配成功時,確定驗證結果正確,匹配失敗時,確定驗證結果錯誤。
上述的方法,步驟C具體包括:
將所述數據文件的文件頭部依次與已知文件類型庫中的每種文件類型的內容特征進行匹配,并將匹配到的文件類型作為所述數據文件的真正文件類型。
上述的方法,步驟C中,將所述數據文件的文件頭部優先與圖片文件的內容特征進行匹配。
一種識別緩存文件的裝置,應用于web代理網關中,所述裝置包括:
第一識別單元,用于根據文件名后綴和/或http頭中的Content-Type字段內容,對http數據中承載的數據文件的文件類型進行初步識別,當通過所述初步識別得到了所述數據文件的文件類型時,觸發驗證單元,當通過所述初步識別未能得到所述數據文件的文件類型時,觸發第二識別單元;
驗證單元,用于根據所述數據文件的文件頭部對所述初步識別得到的文件類型進行驗證,當驗證結果正確時,將所述初步識別得到的文件類型確定為真正文件類型,觸發緩存識別單元,當驗證結果錯誤時,觸發第二識別單元;
第二識別單元,用于根據所述數據文件的文件頭部確定所述數據文件的真正文件類型;
緩存識別單元,用于根據所述數據文件的真正文件類型確定所述數據文件是否為可緩存文件。
上述的裝置,其中,所述驗證單元進一步用于:
將所述數據文件的文件頭部與所述初步識別得到的文件類型的內容特征進行匹配,匹配成功時,確定驗證結果正確,匹配失敗時,確定驗證結果錯誤。
上述的裝置,其中,所述第二識別單元進一步用于:
將所述數據文件的文件頭部依次與已知文件類型庫中的每種文件類型的內容特征進行匹配,并將匹配到的文件類型作為所述數據文件的真正文件類型。
上述的裝置,其中,所述第二識別單元將所述數據文件的文件頭部優先與圖片文件的內容特征進行匹配。
本發明通過結合http頭中的Content-Type字段內容以及http數據流來進行文件類型識別的綜合判斷,能夠準確獲知當前傳輸的文件類型,從而達到對可以緩存文件不遺漏的目的,并能夠防止對不應該緩存的文件錯誤的進行緩存。
附圖說明
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于星云融創(北京)信息技術有限公司,未經星云融創(北京)信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310308214.0/2.html,轉載請聲明來源鉆瓜專利網。





