[發(fā)明專利]標(biāo)記語言文檔的處理方法及瀏覽器和網(wǎng)絡(luò)操作系統(tǒng)在審
| 申請(qǐng)?zhí)枺?/td> | 201110306697.1 | 申請(qǐng)日: | 2011-10-11 |
| 公開(公告)號(hào): | CN103049439A | 公開(公告)日: | 2013-04-17 |
| 發(fā)明(設(shè)計(jì))人: | 張富春 | 申請(qǐng)(專利權(quán))人: | 騰訊科技(深圳)有限公司 |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30 |
| 代理公司: | 北京德琦知識(shí)產(chǎn)權(quán)代理有限公司 11018 | 代理人: | 謝安昆;宋志強(qiáng) |
| 地址: | 518044 廣東省深圳*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 標(biāo)記 語言 文檔 處理 方法 瀏覽器 網(wǎng)絡(luò) 操作系統(tǒng) | ||
技術(shù)領(lǐng)域
本發(fā)明涉及互聯(lián)網(wǎng)數(shù)據(jù)處理技術(shù)領(lǐng)域,尤其涉及一種標(biāo)記語言文檔的處理方法及相應(yīng)的瀏覽器和網(wǎng)絡(luò)操作系統(tǒng)。
背景技術(shù)
在互聯(lián)網(wǎng)中,網(wǎng)頁的本質(zhì)就是標(biāo)記語言,如超文本標(biāo)記語言(HTML,Hypertext?Markup?Language)以及可擴(kuò)展標(biāo)記語言(XML,Extensible?Markup?Language)。HTML和XML是用于描述網(wǎng)頁文檔的一種標(biāo)記語言。HTML是一種規(guī)范,一種標(biāo)準(zhǔn),它通過標(biāo)記符號(hào)來標(biāo)記要顯示的網(wǎng)頁中的各個(gè)部分。XML是Internet環(huán)境中跨平臺(tái)的,依賴于內(nèi)容的技術(shù),是當(dāng)前處理結(jié)構(gòu)化文檔信息的有力工具。網(wǎng)頁文件本身是一種文本文件,通過在文本文件中添加標(biāo)記符,可以告訴瀏覽器如何顯示其中的內(nèi)容(如:文字如何處理,畫面如何安排,圖片如何顯示等)。瀏覽器按順序閱讀網(wǎng)頁文件,然后根據(jù)標(biāo)記符解釋和顯示其標(biāo)記的內(nèi)容,對(duì)書寫出錯(cuò)的標(biāo)記將不指出其錯(cuò)誤,且不停止其解釋執(zhí)行過程,編制者只能通過顯示效果來分析出錯(cuò)原因和出錯(cuò)部位。但需要注意的是,對(duì)于不同的瀏覽器,對(duì)同一標(biāo)記符可能會(huì)有不完全相同的解釋,因而可能會(huì)有不同的顯示效果。
HTML可以通過結(jié)合使用其他的網(wǎng)絡(luò)技術(shù),如:腳本語言、計(jì)算機(jī)圖形接口標(biāo)準(zhǔn)(CGI)、組件等,可以創(chuàng)造出功能強(qiáng)大的網(wǎng)頁。因而,HTML是網(wǎng)絡(luò)頁面的基礎(chǔ),也就是說互聯(lián)網(wǎng)是建立在HTML基礎(chǔ)之上的。
所述瀏覽器是指可以顯示網(wǎng)頁服務(wù)器或者文件系統(tǒng)的HTML文檔內(nèi)容,并讓用戶與這些文件交互的一種軟件。網(wǎng)頁瀏覽器主要通過HTTP協(xié)議與網(wǎng)頁服務(wù)器交互并獲取網(wǎng)頁,這些網(wǎng)頁由統(tǒng)一資源定位符(URL)指定,文件格式通常為HTML,并由MIME在HTTP協(xié)議中指明。一個(gè)網(wǎng)頁中可以包括多個(gè)文檔,每個(gè)文檔都是分別從服務(wù)器獲取的。大部分的瀏覽器本身支持除了HTML之外的廣泛的格式,例如JPEG、PNG、GIF等圖像格式,并且能夠擴(kuò)展支持眾多的插件(plug-ins)。另外,許多瀏覽器還支持其他的URL類型及其相應(yīng)的協(xié)議,如FTP、Gopher、HTTPS(HTTP協(xié)議的加密版本)。HTTP內(nèi)容類型和URL協(xié)議規(guī)范允許網(wǎng)頁設(shè)計(jì)者在網(wǎng)頁中嵌入圖像、動(dòng)畫、視頻、聲音、流媒體等。
目前,瀏覽器解析HTML文檔的過程包括:
步驟101、將嵌套的一系列HTML標(biāo)簽解析為一顆文檔樹,即文檔對(duì)象模型DOM(Document?Object?Model)樹。
DOM可以以一種獨(dú)立于平臺(tái)和語言的方式訪問和修改一個(gè)文檔的內(nèi)容和結(jié)構(gòu)。換句話說,這是表示和處理一個(gè)HTML或可擴(kuò)展標(biāo)記語言(XML)文檔的常用方法。有一點(diǎn)很重要,DOM的設(shè)計(jì)是以對(duì)象管理組織(OMG)的規(guī)約為基礎(chǔ)的,因此可以用于任何編程語言。最初人們把它認(rèn)為是一種讓JavaScript在瀏覽器間可移植的方法,不過DOM的應(yīng)用已經(jīng)遠(yuǎn)遠(yuǎn)超出這個(gè)范圍。DOM技術(shù)使得用戶頁面可以動(dòng)態(tài)地變化,如可以動(dòng)態(tài)地顯示或隱藏一個(gè)元素,改變它們的屬性,增加一個(gè)元素等,DOM技術(shù)使得頁面的交互性大大地增強(qiáng)。DOM實(shí)際上是以面向?qū)ο蠓绞矫枋龅奈臋n模型。DOM定義了表示和修改文檔所需的對(duì)象、這些對(duì)象的行為和屬性以及這些對(duì)象之間的關(guān)系。可以把DOM認(rèn)為是頁面上數(shù)據(jù)和結(jié)構(gòu)的一個(gè)樹形表示,不過頁面當(dāng)然可能并不是以這種樹的方式具體實(shí)現(xiàn)。
DOM樹描述了頁面上各個(gè)元素之間的層級(jí)關(guān)系和順序。例如,針對(duì)以下HTML文檔,瀏覽器將該HTML文檔解析成如圖1所示的一顆DOM樹。
參見圖1,所述HTML文檔中的每個(gè)標(biāo)簽以及每個(gè)標(biāo)簽內(nèi)的屬性,都會(huì)轉(zhuǎn)換為DOM文檔樹中對(duì)應(yīng)的節(jié)點(diǎn)。同時(shí),在轉(zhuǎn)換過程中,還需要對(duì)格式不標(biāo)準(zhǔn)或錯(cuò)誤的部分進(jìn)行容錯(cuò)處理。在瀏覽器內(nèi)存中一般以連續(xù)數(shù)據(jù)結(jié)構(gòu)的形式表示解析后的DOM樹,所述連續(xù)數(shù)據(jù)結(jié)構(gòu)例如可以為鏈表或數(shù)組。如圖2所示為瀏覽器內(nèi)存中以鏈表的形式表示圖1所述DOM樹的示意圖。
步驟102、瀏覽器的渲染引擎再將所述DOM樹中的各個(gè)節(jié)點(diǎn)轉(zhuǎn)換為圖形,渲染出最終網(wǎng)頁的畫面。
現(xiàn)有技術(shù)中,瀏覽器每一次打開一個(gè)HTML文檔,都要執(zhí)行上述對(duì)HTML文檔的解析過程。然而,HTML文檔的解析是一項(xiàng)繁瑣復(fù)雜而耗時(shí)的過程,同時(shí),HTML文檔中的無意義的空白字符增加了文檔的體積,使得HTML文檔在再次打開或者傳輸?shù)倪^程中,耗費(fèi)了大量的時(shí)間和帶寬資源。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于騰訊科技(深圳)有限公司,未經(jīng)騰訊科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110306697.1/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 標(biāo)記裝置及標(biāo)記方法
- 同步數(shù)字體系網(wǎng)絡(luò)標(biāo)記交換的標(biāo)記處理方法
- 標(biāo)記裝置及標(biāo)記方法
- 標(biāo)記頭和標(biāo)記裝置
- 用于通過標(biāo)記光線標(biāo)記物體的標(biāo)記設(shè)備
- 標(biāo)記裝置以及標(biāo)記方法
- 標(biāo)記系統(tǒng)
- 激光標(biāo)記方法、激光標(biāo)記機(jī)及存儲(chǔ)介質(zhì)
- 用于標(biāo)記標(biāo)記對(duì)象的標(biāo)記系統(tǒng)
- 標(biāo)記方法及標(biāo)記裝置
- 自動(dòng)檢測(cè)文件中搭配錯(cuò)誤的系統(tǒng)和方法
- 網(wǎng)絡(luò)連接裝置及網(wǎng)絡(luò)連接裝置的語言環(huán)境設(shè)定方法
- 一種口語評(píng)測(cè)方法及裝置
- 一種語言設(shè)置方法及移動(dòng)終端
- 一種語言文本加載方法和裝置
- 一種語言交流人工智能系統(tǒng)及其語言處理方法
- 語言序列標(biāo)注方法、裝置存儲(chǔ)介質(zhì)及計(jì)算機(jī)設(shè)備
- 一種基于語言包實(shí)現(xiàn)繼電保護(hù)裝置多語言版本方法及裝置
- 一種應(yīng)用軟件的多語言核對(duì)方法及系統(tǒng)
- 多語言字幕顯示方法、裝置、終端設(shè)備及存儲(chǔ)介質(zhì)
- 一種電子文檔識(shí)別方法及裝置
- 文檔匹配方法和文檔匹配裝置
- 復(fù)雜文檔分離組織方法以及復(fù)雜文檔自動(dòng)生成方法
- 一種文檔流程控制方法及裝置
- 云文檔加密及解密方法、加密及解密裝置、以及處理系統(tǒng)
- 一種將Markdown文檔轉(zhuǎn)換為PDF文檔的方法、裝置
- 文檔類型識(shí)別方法、裝置、設(shè)備和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 基于文檔編輯軟件的文檔處理方法、裝置、設(shè)備及介質(zhì)
- 一種引用文檔的更新方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 文檔操作錄制方法、文檔操作動(dòng)畫生成方法、裝置及設(shè)備





