日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]網(wǎng)頁(yè)正文的提取方法和裝置、網(wǎng)頁(yè)預(yù)覽方法和系統(tǒng)有效

專利信息
申請(qǐng)?zhí)枺?/td> 201310339555.4 申請(qǐng)日: 2013-08-06
公開(公告)號(hào): CN103425765A 公開(公告)日: 2013-12-04
發(fā)明(設(shè)計(jì))人: 梁捷;趙闖 申請(qǐng)(專利權(quán))人: 優(yōu)視科技有限公司
主分類號(hào): G06F17/30 分類號(hào): G06F17/30
代理公司: 暫無(wú)信息 代理人: 暫無(wú)信息
地址: 100080 北京市海淀區(qū)*** 國(guó)省代碼: 北京;11
權(quán)利要求書: 查看更多 說(shuō)明書: 查看更多
摘要:
搜索關(guān)鍵詞: 網(wǎng)頁(yè) 正文 提取 方法 裝置 預(yù)覽 系統(tǒng)
【說(shuō)明書】:

技術(shù)領(lǐng)域

發(fā)明涉及移動(dòng)通信技術(shù)領(lǐng)域,更為具體地,涉及網(wǎng)頁(yè)正文的提取方法和裝置、網(wǎng)頁(yè)預(yù)覽方法和系統(tǒng)。

背景技術(shù)

隨著互聯(lián)網(wǎng)的不斷發(fā)展,web網(wǎng)頁(yè)數(shù)量日益龐大,越來(lái)越多的人通過(guò)請(qǐng)求web網(wǎng)頁(yè)來(lái)獲取信息,但也存在不少的數(shù)據(jù)干擾,對(duì)web網(wǎng)頁(yè)的請(qǐng)求者造成訪問(wèn)障礙,而請(qǐng)求者真正想要有用的信息都在web網(wǎng)頁(yè)正文中,因此迫切需要一種提取web網(wǎng)頁(yè)正文技術(shù),以幫助請(qǐng)求者有效獲取web網(wǎng)頁(yè)的正文數(shù)據(jù)。

傳統(tǒng)的網(wǎng)頁(yè)正文提取方法,需經(jīng)過(guò)瀏覽器內(nèi)核建立DOM(Document?Object?Model,文件對(duì)象模型)樹,通過(guò)JavaScript引擎進(jìn)行解析來(lái)抽取正文;其中一個(gè)典型的網(wǎng)頁(yè)正文提取過(guò)程大致如下:先找出網(wǎng)頁(yè)HTML文檔的特定標(biāo)簽項(xiàng),利用該特定標(biāo)簽項(xiàng)將HTML文檔表示成一個(gè)DOM樹的結(jié)構(gòu),然后通過(guò)JavaScript引擎進(jìn)行解析提取DOM樹中有效的樹節(jié)點(diǎn)數(shù)據(jù)來(lái)抽取正文,因此這種傳統(tǒng)的網(wǎng)頁(yè)正文提取速度非常慢。

發(fā)明內(nèi)容

鑒于上述傳統(tǒng)的網(wǎng)頁(yè)正文提取速度非常慢的問(wèn)題,本發(fā)明提出了一種網(wǎng)頁(yè)正文的提取方法和裝置,該方法及裝置可以快速提取網(wǎng)頁(yè)的正文內(nèi)容,降低對(duì)系統(tǒng)內(nèi)存的占用率。

根據(jù)本發(fā)明的一個(gè)方面,提供了一種網(wǎng)頁(yè)正文的提取方法,包括以下步驟:

提取網(wǎng)頁(yè)主體塊的數(shù)據(jù);

從所述網(wǎng)頁(yè)主體塊的數(shù)據(jù)中篩選與網(wǎng)頁(yè)正文相關(guān)的字符;

對(duì)所述與網(wǎng)頁(yè)正文相關(guān)的字符進(jìn)行去HTML標(biāo)簽處理和切割處理,獲取各行字符串?dāng)?shù)組;

從所述字符串?dāng)?shù)組的第一行開始按設(shè)定的行塊大小逐行掃描;

當(dāng)掃描到所述設(shè)定的行塊中的字符數(shù)大于或者等于設(shè)定的字?jǐn)?shù)閾值時(shí),輸出所述設(shè)定的行塊中的字符。

根據(jù)本發(fā)明的另一個(gè)方面,提供了一種網(wǎng)頁(yè)正文的提取裝置,其包括:

提取單元,用于提取網(wǎng)頁(yè)主體塊的數(shù)據(jù);

篩選單元,用于從所述網(wǎng)頁(yè)主體塊的數(shù)據(jù)中篩選與網(wǎng)頁(yè)正文相關(guān)的字符;

標(biāo)準(zhǔn)化處理單元,用于對(duì)所述與網(wǎng)頁(yè)正文相關(guān)的字符進(jìn)行去HTML標(biāo)簽處理和切割處理,獲取各行字符串?dāng)?shù)組;

掃描單元,用于從所述字符串?dāng)?shù)組的第一行開始按設(shè)定的行塊大小逐行掃描;

輸出單元,用于當(dāng)掃描到所述設(shè)定的行塊中的字符數(shù)大于或者等于設(shè)定的字?jǐn)?shù)閾值時(shí),輸出所述設(shè)定的行塊中的字符。

利用上述方法及系統(tǒng),在提取到網(wǎng)頁(yè)主體塊的數(shù)據(jù)后,先進(jìn)行字符篩選,將與網(wǎng)頁(yè)正文無(wú)關(guān)的字符過(guò)濾掉,得到與網(wǎng)頁(yè)正文相關(guān)的字符;在對(duì)與網(wǎng)頁(yè)相關(guān)的字符進(jìn)行切割處理和去HTML標(biāo)簽處理,得到各行字符串?dāng)?shù)組,從字符串?dāng)?shù)組的第一行開始按設(shè)定的行塊大小逐行掃描,當(dāng)行塊中的字符數(shù)大于或者等于預(yù)設(shè)的字?jǐn)?shù)閾值時(shí),輸出行塊中的字符;并不需要建立DOM樹,也不需要JavaScript引擎進(jìn)行解析來(lái)抽取正文;正文提取速度明顯提高,也降低了系統(tǒng)的內(nèi)存占用率。

本發(fā)明的另一方面,提出一種網(wǎng)頁(yè)預(yù)覽方法和系統(tǒng),可以提高網(wǎng)頁(yè)顯示的速度,減少請(qǐng)求網(wǎng)頁(yè)時(shí)的等待時(shí)間。

本發(fā)明提出一種網(wǎng)頁(yè)預(yù)覽方法,包括步驟:

當(dāng)接收到網(wǎng)頁(yè)預(yù)覽請(qǐng)求消息時(shí),對(duì)根據(jù)網(wǎng)頁(yè)鏈接請(qǐng)求返回的網(wǎng)頁(yè)主文檔進(jìn)行解碼,獲取網(wǎng)頁(yè)主文檔字符串;

利用如權(quán)利要求1所述的網(wǎng)頁(yè)正文的提取方法從所述網(wǎng)頁(yè)主文檔字符串中提取網(wǎng)頁(yè)正文;

將所述網(wǎng)頁(yè)正文進(jìn)行顯示格式處理后顯示。

本發(fā)明還提出一種網(wǎng)頁(yè)預(yù)覽系統(tǒng),包括:

解碼裝置,用于當(dāng)接收到網(wǎng)頁(yè)預(yù)覽請(qǐng)求消息時(shí),對(duì)根據(jù)網(wǎng)頁(yè)鏈接請(qǐng)求返回的網(wǎng)頁(yè)主文檔進(jìn)行解碼,獲取網(wǎng)頁(yè)主文檔字符串;

如權(quán)利要求6所述的網(wǎng)頁(yè)正文的提取裝置,用于從所述網(wǎng)頁(yè)主文檔字符串中提取網(wǎng)頁(yè)正文;

顯示裝置,將所述網(wǎng)頁(yè)正文進(jìn)行顯示格式處理后顯示。

采用上述網(wǎng)頁(yè)預(yù)覽的方法和系統(tǒng),對(duì)根據(jù)網(wǎng)頁(yè)預(yù)覽請(qǐng)求返回的網(wǎng)頁(yè)主文檔進(jìn)行解碼,獲取網(wǎng)頁(yè)主文檔字符串,然后利用本發(fā)明提出的網(wǎng)頁(yè)正文提取技術(shù),可以提高網(wǎng)頁(yè)正文的提取速度,因此,可以提高網(wǎng)頁(yè)顯示的速度,減少請(qǐng)求網(wǎng)頁(yè)時(shí)的等待時(shí)間。

為了實(shí)現(xiàn)上述以及相關(guān)目的,本發(fā)明的一個(gè)或多個(gè)方面包括后面將詳細(xì)說(shuō)明并在權(quán)利要求中特別指出的特征。下面的說(shuō)明以及附圖詳細(xì)說(shuō)明了本發(fā)明的某些示例性方面。然而,這些方面指示的僅僅是可使用本發(fā)明的原理的各種方式中的一些方式。此外,本發(fā)明旨在包括所有這些方面以及它們的等同物。

附圖說(shuō)明

根據(jù)下述參照附圖進(jìn)行的詳細(xì)描述,本發(fā)明的上述和其他目的、特征和優(yōu)點(diǎn)將變得更加顯而易見。在附圖中:

圖1示出了本發(fā)明方法的一個(gè)流程圖;

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會(huì)員可以免費(fèi)下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于優(yōu)視科技有限公司,未經(jīng)優(yōu)視科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201310339555.4/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說(shuō)明:

1、專利原文基于中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局專利說(shuō)明書;

2、支持發(fā)明專利 、實(shí)用新型專利、外觀設(shè)計(jì)專利(升級(jí)中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級(jí)為極速版,下載速度顯著提升!歡迎使用!

請(qǐng)您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊(cè)】

關(guān)于我們 尋求報(bào)道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識(shí) 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢?cè)诰€客服咨詢?cè)诰€客服
tel code back_top
主站蜘蛛池模板: 国产91九色在线播放| 99久久婷婷国产综合精品草原| 欧美亚洲视频二区| 岛国黄色av| 国产精品免费一视频区二区三区 | 狠狠色成色综合网| 91视频国产九色| 欧美在线视频精品| 99热一区二区| 中文字幕欧美久久日高清| 少妇厨房与子伦在线观看| 国产高清精品一区| 日本午夜精品一区二区三区| 久久99久久99精品蜜柚传媒 | 91精品国产影片一区二区三区| 午夜码电影| 99三级视频| 国产原创一区二区| **毛片免费| 88国产精品视频一区二区三区| 欧美大片一区二区三区| 国产精品麻豆一区二区| 国产精品1234区| 国产69精品久久久久777| 亚洲欧洲日韩av| 强制中出し~大桥未久10| 国产一区二区三区大片| 99久久精品国| 国产真裸无庶纶乱视频| 国产97在线播放| 视频一区欧美| 欧美性xxxxx极品少妇| 亚洲精品久久久久不卡激情文学| 国产乱一区二区三区视频| 亚洲理论影院| 欧美日韩综合一区 | 久久99精品久久久久婷婷暖91| 国产91清纯白嫩初高中在线观看| 免费看大黄毛片全集免费| 欧美在线一区二区视频| 偷拍久久精品视频| 最新国产精品久久精品| 国产69精品久久99的直播节目| 爽妇色啪网| 欧洲激情一区二区| 玖玖精品国产| 四虎精品寂寞少妇在线观看| 欧美日韩国产精品一区二区| 国产91精品一区二区麻豆亚洲| 欧美一区二区三区免费电影| 免费精品一区二区三区第35| 国产一区二区伦理| 国产精品99在线播放| 国产精品久久久久久亚洲美女高潮 | 日本一区欧美| 久久五月精品| 久久99国产视频| 狠狠躁狠狠躁视频专区| 日本精品一区二区三区在线观看视频| 中文字幕在线视频一区二区| 国产二区三区视频| 久久激情综合网| 国产精品日产欧美久久久久| 午夜爱爱电影| 69精品久久| 欧美日韩国产123| 麻豆91在线| 99欧美精品| 久久九九亚洲| 91夜夜夜| 日本aⅴ精品一区二区三区日| 亚洲精品久久久久不卡激情文学| 国产精品一区在线观看你懂的| 国产精品视频一二区| 色婷婷综合久久久中文一区二区| 国产精品日产欧美久久久久| 久久99精品久久久久婷婷暖91| 国产91白嫩清纯初高中在线| 综合国产一区| 69久久夜色精品国产69乱青草| 欧美乱妇高清无乱码免费 | 精品国产九九| 色噜噜狠狠色综合久| 亚洲综合日韩精品欧美综合区| 国产在线一区观看| 久久久久久国产精品免费| 国产午夜精品一区| 久久99久久99精品免观看软件| 国产午夜一级片| 国产色99| 亚洲第一天堂无码专区 | 国产床戏无遮挡免费观看网站 | 午夜特级片| 国内精品久久久久久久星辰影视| 真实的国产乱xxxx在线91| 狠狠躁夜夜躁人人爽天天天天97| 少妇又紧又色又爽又刺激的视频| 精品国产乱码久久久久久软件影片| 狠狠色噜噜狠狠狠四色米奇| 亚洲精品日本无v一区| 国产午夜精品一区二区理论影院| 国产欧美一区二区三区精品观看| 精品少妇的一区二区三区四区| 日韩av在线导航| 欧美日本三级少妇三级久久| 精品福利一区二区| 精品999久久久| 日韩精品午夜视频| www.午夜av| 亚洲国产午夜片| 国内精品久久久久久久星辰影视| 日本道欧美一区二区aaaa| 国产视频精品一区二区三区| 国产清纯白嫩初高生视频在线观看| 一区二区中文字幕在线观看| 欧美一级久久久| 偷拍自中文字av在线| 国产精品综合久久| 狠狠色噜噜狠狠狠狠视频| 国产精品久久久视频| 亚洲欧美一卡| 欧美精品久久一区二区| 日本美女视频一区二区| 亚洲欧美制服丝腿| 国产1区2区3区中文字幕| 日韩一区二区精品| 91久久久久久亚洲精品禁果| 国产精品一区一区三区| 年轻bbwwbbww高潮| 88国产精品欧美一区二区三区三| 国产精品九九九九九九| 久99精品| 97人人模人人爽人人喊小说| 精品videossexfreeohdbbw| 国产1区在线观看| 久久99国产精品视频| 国产午夜精品一区二区三区四区 | 亚洲精品国产精品国自产网站按摩| 日本一二三区视频在线| 久久99精品久久久久国产越南 | 久久一级精品视频| 国产在线观看二区| 97久久精品人人做人人爽| 欧美激情在线一区二区三区| 久久国产精品99国产精| 久久久久久久亚洲国产精品87| 日韩欧美中文字幕一区| 国产高清一区在线观看| 日韩亚洲精品在线观看| 一区二区中文字幕在线观看| 欧美激情在线一区二区三区| 中文字幕精品一区二区三区在线| 在线亚洲精品| 亚洲乱子伦| 91精品高清| 欧美日韩一区不卡| 亚洲一区二区福利视频| 久久99国产视频| 日韩av在线网| 久久久久亚洲精品视频| 视频一区欧美| av国产精品毛片一区二区小说| 久久99精品久久久秒播| 6080日韩午夜伦伦午夜伦| 欧美国产在线看| 26uuu亚洲电影在线观看| 国产高清在线精品一区二区三区| 免费看大黄毛片全集免费| 午夜影院黄色片| 亚洲午夜精品一区二区三区| 国产一区不卡视频| 久久久久久久亚洲视频| 欧美日韩激情一区| 狠狠插狠狠干| 国产精品视频1区| 精品国产一二区| 久99久视频| 国产一区二区综合| 日本午夜久久| 午夜私人影院在线观看| 狠狠色噜噜狠狠狠四色米奇| 国产男女乱淫视频高清免费| 欧美hdfree性xxxx| 野花国产精品入口| 强制中出し~大桥未久10| freexxxxxxx| 91久久综合亚洲鲁鲁五月天| 国产亚洲精品久久久久久网站| 国产在线观看二区| 91嫩草入口| 午夜影院一级片| 国产精品久久久久精| 国久久久久久| 日本美女视频一区二区| 午夜情所理论片| 玖玖国产精品视频| 国产一区二区视频免费观看| 91麻豆精品国产91久久久久| free性欧美hd另类丰满| 国产精品久久久久激情影院| 午夜av免费观看| 国产一级片一区二区| 亚洲精品卡一| 国产一区二区在| 欧美一区二区三区白人| 93精品国产乱码久久久| 精品综合久久久久| 国产午夜三级一区二区三| 99国产精品久久久久99打野战| 国产一级大片| 久久免费视频一区二区| 国产一区二区在| 久久99久国产精品黄毛片入口| 日韩av在线网址| 91福利视频免费观看| 99久久99精品| 国模精品免费看久久久| 91av中文字幕| 久久91久久久久麻豆精品| 制服丝袜视频一区| 素人av在线| 狠狠色丁香久久婷婷综| 91久久一区二区| 国产69精品久久久久9999不卡免费 | 日韩精品少妇一区二区在线看| 国产大片一区二区三区| 欧美xxxxhdvideos| 亚洲精品卡一| 久久久久久亚洲精品| 999国产精品999久久久久久| 欧美精品免费视频| 国产精品96久久久久久久| **毛片免费| 香蕉av一区二区三区| 少妇精品久久久久www蜜月| 亚洲精品456| 精品国产一二三四区| 国产精品综合在线观看| 999久久久国产| av不卡一区二区三区| 精品欧美一区二区精品久久小说| 久久婷婷国产麻豆91天堂徐州| 日本精品一区二区三区视频| 国产麻豆一区二区三区精品| 少妇厨房与子伦在线观看| 日本二区在线播放|