[發明專利]用于嵌入式瀏覽器的網頁編碼語言自動識別方法及裝置有效
| 申請號: | 200710143874.2 | 申請日: | 2007-08-03 |
| 公開(公告)號: | CN101101606A | 公開(公告)日: | 2008-01-09 |
| 發明(設計)人: | 謝曼 | 申請(專利權)人: | 中興通訊股份有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;H04L29/06 |
| 代理公司: | 北京康信知識產權代理有限責任公司 | 代理人: | 尚志峰;吳孟秋 |
| 地址: | 518057廣東省深圳市南*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 嵌入式 瀏覽器 網頁 編碼 語言 自動識別 方法 裝置 | ||
1.一種用于嵌入式瀏覽器的網頁編碼語言自動識別方法,其特征在于,包括以下步驟:
S102,從所述嵌入式瀏覽器的協議棧中獲取網頁數據和協議頭;
S104,解析所述網頁數據和所述協議頭,以獲得指明網頁編碼的元數據;以及
S106,利用從所述網頁數據中獲取的元數據和從所述協議頭中獲取的元數據,根據優先級判斷第一次文本解析應該使用的編碼;
S108,根據所采用的編碼解析當前數據塊,并統計解析過程中出現的錯誤,并且在出現錯誤的情況下,再次選擇編碼進行解析。
2.根據權利要求1所述的網頁編碼語言自動識別方法,其特征在于,所述S106包括:
將從所述網頁數據獲取的元數據或所述協議頭中獲取的元數據的優先級設置為最高,在其中至少之一存在的情況下,采用該種元數據指示的編碼進行解析;在均不存在的情況下,采用從同一網頁的其他數據塊的網頁數據或協議頭獲取的元數據指示的編碼進行解析;在不存在所述同一網頁的其他數據塊的網頁數據和協議頭的情況下,采用所述瀏覽器內置的缺省編碼進行解析。
3.根據權利要求2所述的網頁編碼語言自動識別方法,其特征在于,在所述步驟S108中,在解析無錯誤的情況下,將采用的編碼的優先級設置為最高,在解析出現錯誤的情況下,繼續選擇編碼進行解析。
4.一種用于嵌入式瀏覽器的網頁編碼語言自動識別裝置,其特征在于,包括:
數據獲取模塊,用于從嵌入式瀏覽器的協議棧中獲取部分網頁數據和協議頭;
數據解析模塊,用于解析所述網頁數據和所述協議頭,以獲得指明網頁編碼的元數據;
編碼確定模塊,用于利用從所述網頁數據中獲取的元數據和從所述協議頭中獲取的元數據,根據優先級判斷第一次文本解析應該使用的編碼;以及
解析模塊,根據所采用的編碼解析當前數據塊,并統計解析過程中出現的錯誤,并且在出現錯誤的情況下,再次選擇編碼進行解析。
5.根據權利要求4所述的網頁編碼語言自動識別裝置,其特征在于,所述編碼確定模塊將從所述網頁數據獲取的元數據或所述協議頭中獲取的元數據的優先級設置為最高,在其中至少之一存在的情況下,采用該種元數據指示的編碼進行解析;在均不存在的情況下,采用從同一網頁的其他數據塊的網頁數據或協議頭獲取的元數據指示的編碼進行解析;以及在不存在所述同一網頁的其他數據塊的網頁數據和協議頭的情況下,采用所述瀏覽器內置的缺省編碼進行解析。
6.根據權利要求5所述的網頁編碼語言自動識別裝置,其特征在于,在解析無錯誤的情況下,所述編碼確定模塊將采用的編碼的優先級設置為最高,在解析出現錯誤的情況下,所述編碼確定模塊繼續選擇編碼以進行解析。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中興通訊股份有限公司,未經中興通訊股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200710143874.2/1.html,轉載請聲明來源鉆瓜專利網。





