日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專(zhuān)利]一種網(wǎng)頁(yè)信息提取系統(tǒng)及提取方法有效

專(zhuān)利信息
申請(qǐng)?zhí)枺?/td> 201410138234.2 申請(qǐng)日: 2014-04-08
公開(kāi)(公告)號(hào): CN103870606B 公開(kāi)(公告)日: 2017-05-10
發(fā)明(設(shè)計(jì))人: 張嘯晨;郭少鵬;呂強(qiáng);賀文磊 申請(qǐng)(專(zhuān)利權(quán))人: 上海語(yǔ)天信息技術(shù)有限公司
主分類(lèi)號(hào): G06F17/30 分類(lèi)號(hào): G06F17/30
代理公司: 上海申新律師事務(wù)所31272 代理人: 俞滌炯
地址: 200120 上海市浦*** 國(guó)省代碼: 上海;31
權(quán)利要求書(shū): 查看更多 說(shuō)明書(shū): 查看更多
摘要:
搜索關(guān)鍵詞: 一種 網(wǎng)頁(yè) 信息 提取 系統(tǒng) 方法
【權(quán)利要求書(shū)】:

1.一種網(wǎng)頁(yè)信息提取系統(tǒng),其特征在于,包括:

網(wǎng)頁(yè)信息捕捉單元,用于在瀏覽器側(cè)下載預(yù)設(shè)的網(wǎng)頁(yè),并捕捉所述網(wǎng)頁(yè)的網(wǎng)址信息和網(wǎng)頁(yè)編碼信息;

網(wǎng)址過(guò)濾單元,連接所述網(wǎng)頁(yè)信息捕捉單元,預(yù)設(shè)有多個(gè)標(biāo)準(zhǔn)網(wǎng)址信息,并用于根據(jù)預(yù)設(shè)的所述標(biāo)準(zhǔn)網(wǎng)址信息對(duì)所述網(wǎng)址信息進(jìn)行匹配,以獲得匹配于所述標(biāo)準(zhǔn)網(wǎng)址信息的有效網(wǎng)址信息;

網(wǎng)頁(yè)信息提取單元,分別連接所述網(wǎng)頁(yè)信息捕捉單元和所述網(wǎng)址過(guò)濾單元,用于提取對(duì)應(yīng)所述有效網(wǎng)址信息的所述網(wǎng)頁(yè)編碼信息,并將所述網(wǎng)頁(yè)編碼信息分為多個(gè)信息塊,查找到字節(jié)密度驟升的所述信息塊和字節(jié)密度驟降的所述信息塊;

所述網(wǎng)頁(yè)信息提取單元將位于字節(jié)密度驟升的所述信息塊和字節(jié)密度驟降的所述信息塊之間的所述網(wǎng)頁(yè)編碼信息確定為網(wǎng)頁(yè)信息,并輸出所述網(wǎng)頁(yè)信息;

所述網(wǎng)址過(guò)濾單元包括:

網(wǎng)址分割模塊,用于接收所述網(wǎng)頁(yè)信息捕捉單元捕獲的網(wǎng)址信息,并將所述網(wǎng)址信息分割為域名信息、URL路徑信息以及URL實(shí)體信息;

標(biāo)準(zhǔn)網(wǎng)址存儲(chǔ)模塊,保存有所述標(biāo)準(zhǔn)網(wǎng)址信息,所述標(biāo)準(zhǔn)網(wǎng)址信息包括標(biāo)準(zhǔn)域名信息和標(biāo)準(zhǔn)URL路徑信息;

網(wǎng)址匹配模塊,分別連接所述網(wǎng)址分割模塊和所述標(biāo)準(zhǔn)網(wǎng)址存儲(chǔ)模塊,用于將所述域名信息與所述標(biāo)準(zhǔn)域名信息進(jìn)行匹配,以及將所述URL路徑信息與所述標(biāo)準(zhǔn)URL路徑信息匹配,并將匹配成功的所述網(wǎng)址信息標(biāo)記為有效網(wǎng)址信息;

所述網(wǎng)頁(yè)信息提取單元中包括:

編碼轉(zhuǎn)換模塊,用于根據(jù)所述網(wǎng)頁(yè)編碼信息的編碼類(lèi)型選擇相應(yīng)的解碼方式,以將所述網(wǎng)頁(yè)編碼信息的編碼類(lèi)型轉(zhuǎn)換成對(duì)應(yīng)的UTF-8編碼UTF-8編碼類(lèi)型;

編碼存儲(chǔ)模塊,連接所述編碼轉(zhuǎn)換模塊,用于保存經(jīng)過(guò)轉(zhuǎn)換的所述網(wǎng)頁(yè)編碼信息;

第一符號(hào)轉(zhuǎn)換模塊,連接所述編碼存儲(chǔ)模塊,采用空白信息替代所述編碼存儲(chǔ)模塊中保存的所述網(wǎng)頁(yè)編碼信息中的超文本標(biāo)簽;

信息密度計(jì)算模塊,連接所述第一符號(hào)轉(zhuǎn)換模塊,用于將經(jīng)過(guò)替代后的所述網(wǎng)頁(yè)編碼信息分割為多個(gè)行數(shù)相等的連續(xù)的信息塊,并計(jì)算每個(gè)所述信息塊的字節(jié)密度;

網(wǎng)頁(yè)信息提取模塊,連接所述信息密度計(jì)算模塊,用于根據(jù)所述信息塊的字節(jié)密度的變化趨勢(shì),提取位于字節(jié)密度驟升的所述信息塊和字節(jié)密度驟降的所述信息塊之間的所述網(wǎng)頁(yè)編碼信息,并將被提取的所述網(wǎng)頁(yè)編碼信息作為網(wǎng)頁(yè)信息輸出。

2.如權(quán)利要求1所述的網(wǎng)頁(yè)信息提取系統(tǒng),其特征在于,所述網(wǎng)頁(yè)信息提取單元中還包括:

第二符號(hào)轉(zhuǎn)換模塊,連接于所述編碼存儲(chǔ)模塊與所述第一符號(hào)轉(zhuǎn)換模塊之間,采用換行符替代所述網(wǎng)頁(yè)編碼信息中的分段符,并將經(jīng)過(guò)替代后的所述網(wǎng)頁(yè)編碼信息發(fā)送至所述第一符號(hào)轉(zhuǎn)換模塊中。

3.如權(quán)利要求1所述的網(wǎng)頁(yè)信息提取系統(tǒng),其特征在于,所述信息密度計(jì)算模塊還直接連接所述編碼存儲(chǔ)模塊,用于直接提取保存于所述編碼存儲(chǔ)模塊中的所述網(wǎng)頁(yè)編碼信息,并進(jìn)行劃分和信息密度計(jì)算;

所述網(wǎng)頁(yè)信息提取模塊中包括:

符號(hào)查詢(xún)模塊,根據(jù)位于字節(jié)密度驟降的所述信息塊之前的最接近的區(qū)塊分隔符,查找位于字節(jié)密度驟降的所述信息塊之后的對(duì)應(yīng)的區(qū)塊分隔符;

所述網(wǎng)頁(yè)信息提取模塊將位于兩個(gè)相應(yīng)的所述區(qū)塊分隔符之間的所述網(wǎng)頁(yè)編碼信息作為所述網(wǎng)頁(yè)信息并輸出。

4.一種網(wǎng)頁(yè)信息提取方法,其特征在于,包括:

步驟1,預(yù)設(shè)多個(gè)標(biāo)準(zhǔn)網(wǎng)址信息;

步驟2,在瀏覽器側(cè)下載一個(gè)預(yù)設(shè)的網(wǎng)頁(yè),并獲取所述網(wǎng)頁(yè)的網(wǎng)址信息和對(duì)應(yīng)的網(wǎng)頁(yè)編碼信息;

步驟3,將匹配于所述標(biāo)準(zhǔn)網(wǎng)址信息的所述網(wǎng)址信息標(biāo)記為有效網(wǎng)址信息;

步驟4,提取對(duì)應(yīng)所述有效網(wǎng)址信息的所述網(wǎng)頁(yè)編碼信息,并將所述網(wǎng)頁(yè)編碼信息的編碼類(lèi)型轉(zhuǎn)換為UTF-8編碼類(lèi)型,隨后保存經(jīng)過(guò)轉(zhuǎn)換的所述網(wǎng)頁(yè)編碼信息;

步驟5,采用空白信息替代經(jīng)過(guò)轉(zhuǎn)換后的所述網(wǎng)頁(yè)編碼信息中的超文本標(biāo)簽;

步驟6,將所述網(wǎng)頁(yè)編碼信息劃分為多個(gè)行數(shù)相等的連續(xù)的信息塊,并計(jì)算每個(gè)所述信息塊中的字節(jié)密度;

步驟7,提取位于字節(jié)密度驟升的所述信息塊與字節(jié)密度驟降的所述信息塊之間的所述網(wǎng)頁(yè)編碼信息,以作為對(duì)應(yīng)所述網(wǎng)頁(yè)編碼信息的網(wǎng)頁(yè)信息并輸出。

下載完整專(zhuān)利技術(shù)內(nèi)容需要扣除積分,VIP會(huì)員可以免費(fèi)下載。

該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于上海語(yǔ)天信息技術(shù)有限公司,未經(jīng)上海語(yǔ)天信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201410138234.2/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。

×

專(zhuān)利文獻(xiàn)下載

說(shuō)明:

1、專(zhuān)利原文基于中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局專(zhuān)利說(shuō)明書(shū);

2、支持發(fā)明專(zhuān)利 、實(shí)用新型專(zhuān)利、外觀設(shè)計(jì)專(zhuān)利(升級(jí)中);

3、專(zhuān)利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專(zhuān)利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級(jí)為極速版,下載速度顯著提升!歡迎使用!

請(qǐng)您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊(cè)】

關(guān)于我們 尋求報(bào)道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識(shí) 聯(lián)系我們

鉆瓜專(zhuān)利網(wǎng)在線咨詢(xún)

周一至周五 9:00-18:00

咨詢(xún)?cè)诰€客服咨詢(xún)?cè)诰€客服
tel code back_top
主站蜘蛛池模板: 亚洲欧洲日本在线观看| 国产高清不卡一区| 国产91精品一区二区麻豆亚洲| 少妇高清精品毛片在线视频| 高清人人天天夜夜曰狠狠狠狠| 精品99在线视频| 91精品美女| 欧美精品在线一区二区| www.午夜av| 99久久免费精品视频| 人人澡超碰碰97碰碰碰| 精品在线观看一区二区| 亚洲国产精品国自产拍av| 在线亚洲精品| 视频国产一区二区| 亚洲日韩aⅴ在线视频| 欧美日韩国产精品一区二区| 99riav3国产精品视频| 久久艹亚洲| 日韩精品久久久久久中文字幕8| 欧美一区二区三区视频在线观看| 国产精品一区二区人人爽| 久久乐国产精品| 日韩精品久久久久久久电影99爱| 国产午夜精品一区二区三区在线观看| 欧美精品粉嫩高潮一区二区| 欧美日韩卡一卡二| 狠狠色噜噜狠狠狠狠色综合久老司机| 亚洲欧美一区二区三区1000| 国产精华一区二区精华| 性生交片免费看片| 午夜影院激情| 国产一区二区电影| 国产高清精品一区二区| 国产视频一区二区在线| 亚洲国产99| 夜色av网站| 91精品一区在线观看| 91福利试看| 亚洲欧美日韩精品suv| 2020国产精品自拍| 午夜色影院| 精品无人国产偷自产在线| 欧美日韩久久一区二区| 国产精品日韩视频| 国产剧情在线观看一区二区| 日韩精品一区二区三区四区在线观看| 国产91丝袜在线| 91精品视频在线免费观看| 国产日韩欧美二区| 国产农村妇女精品一区二区| 国产影院一区二区| 日本少妇一区二区三区| 国产亚洲精品久久久456| freexxxxxxx| 99久久国产综合精品女不卡| 不卡在线一区二区| 久久不卡一区| 国产一级片一区| 91一区二区三区在线| 亚洲欧美中日精品高清一区二区 | 天堂av色婷婷一区二区三区| 欧美一区二区三区久久综合| 欧美日韩精品不卡一区二区三区 | 日本一区二区三区在线看| 欧美日韩国产影院| 亚洲精品久久久久玩吗| 综合久久激情| 日本一区二区三区电影免费观看| 91久久综合亚洲鲁鲁五月天| 一区二区在线视频免费观看| 国内久久久| 国产第一区二区三区| 国产97在线播放| 亚洲精品456| 欧美亚洲视频一区| 午夜欧美a级理论片915影院| 日韩中文字幕久久久97都市激情| 国产在线一区观看| 国产高清不卡一区| av毛片精品| 91黄色免费看| 国产一区精品在线观看| 强制中出し~大桥未久在线播放| 久久午夜鲁丝片| 亚洲精品日本无v一区| 亚洲欧美日本一区二区三区| 国产91精品高清一区二区三区 | 一区二区久久久久| 国产美女一区二区三区在线观看 | 爽妇色啪网| 强制中出し~大桥未久在线播放| 四虎国产精品永久在线| 日韩av在线免费电影| 国产精欧美一区二区三区久久| 97久久久久亚洲| 亚洲精品国产久| 中文字幕av一区二区三区高| 日本神影院一区二区三区| 国产精品视频久久| 国产一区免费播放| 狠狠操很很干| 国产精品视频久久久久久| 国产三级在线视频一区二区三区| 亚洲精品www久久久| 精品99免费视频| 国产视频在线一区二区| 91精品综合| 久久免费视频一区二区| 三级视频一区| 日韩精品福利片午夜免费观看| 国产精品久久免费视频| 久久精品一| 久久中文一区二区| 日韩av中文字幕在线免费观看| 一区二区免费在线观看| 国产69精品久久99的直播节目| 国产一区激情| 国产日韩欧美不卡| 北条麻妃久久99精品| www色视频岛国| 国模一区二区三区白浆| 国产二区精品视频 | 狠狠躁狠狠躁视频专区| 国产一区二区三区午夜| 日韩av不卡一区二区| 狠狠色噜噜狠狠狠狠米奇7777| 国产日韩欧美一区二区在线观看| 日韩国产精品久久久久久亚洲| 亚洲乱码av一区二区三区中文在线:| 热99re久久免费视精品频软件 | 国产一区二区视频免费观看| 亚洲精品少妇久久久久| 销魂美女一区二区| 日韩亚洲国产精品| 天干天干天干夜夜爽av| 高清人人天天夜夜曰狠狠狠狠| 99久久免费毛片基地| 久久99国产精品视频| 一本一道久久a久久精品综合蜜臀| 日本高清一二三区| 欧美午夜羞羞羞免费视频app| 四季av中文字幕一区| 97人人澡人人添人人爽超碰| 精品国产一区二区三区免费 | 亚洲国产精品综合| 性欧美一区二区三区| 午夜爽爽爽男女免费观看| 911久久香蕉国产线看观看| 精品国精品国产自在久不卡| 伊人精品一区二区三区| 欧美一级久久精品| 国产伦精品一区二区三区免费优势 | xxxx在线视频| 国产精品5区| 亚洲欧美自拍一区| 丰满少妇高潮惨叫久久久一| 特级免费黄色片| 国产一区二区三区在线电影| 国久久久久久| 国产福利精品一区| 99久国产| 精品无码久久久久国产| 亚洲无人区码一码二码三码| 视频国产一区二区| 肉丝肉足丝袜一区二区三区| 欧美一区二区三区片| 亚洲欧美色图在线| 午夜av影视| 国产区91| 久久久精品二区| 午夜裸体性播放免费观看| 久久99精品久久久久国产越南 | 日韩av在线电影网| 国产91刺激对白在线播放| 99久久精品一区二区| 国产精彩视频一区二区| 国产极品一区二区三区| 国产一卡二卡在线播放| 性色av香蕉一区二区| 国内精品国产三级国产99| 久久99精品久久久野外直播内容| 欧美一级久久久| 国产欧美一区二区三区不卡高清| 久99精品| 精品国产免费久久| 久久综合狠狠狠色97| 国产一区不卡视频| 久久综合二区| 日韩精品中文字幕在线| 激情欧美日韩| 久久一区二区精品| 欧美日韩综合一区| 国产精品日韩高清伦字幕搜索| 日韩国产精品一区二区| 97久久精品一区二区三区观看| 国产1区2区视频| 久久97国产| 国产97免费视频| 国产精品香蕉在线的人| 国产精品免费专区| 日韩欧美中文字幕精品| 欧美亚洲精品suv一区| 综合久久色| 性夜影院在线观看| 久久国产精久久精产国| 欧美一区二区三区久久精品视| 国内久久久久久| 国产一区二区免费电影| 猛男大粗猛爽h男人味| 国产69精品久久久久久久久久| 人人澡超碰碰97碰碰碰| 香港日本韩国三级少妇在线观看| 日本美女视频一区二区| 一本一道久久a久久精品综合蜜臀 国产三级在线视频一区二区三区 日韩欧美中文字幕一区 | 亚洲国产精品肉丝袜久久| 国产一区www| 国产一级一区二区| 国产黄色一区二区三区 | 亚洲欧洲日韩| 欧美一级久久久| 日韩av在线播| 久久aⅴ国产欧美74aaa| 国产精品不卡在线| 中文字幕一级二级三级| 久久久中精品2020中文| 欧美极品少妇xx高潮| 欧美一区二区三区不卡视频| 精品国产精品亚洲一本大道| а√天堂8资源中文在线| 欧美一区二区色| 国产呻吟久久久久久久92 | 午夜激情综合网| 国产精品一二三区视频出来一| 欧美一区二区三区久久久精品| 国产一区免费在线| 国产精品久久久久四虎| 久久影院国产精品| 日韩区欧美久久久无人区| 国产精品人人爽人人做av片| 国产精品影音先锋| 欧美一区二区精品久久| 精品视频久| 精品国产一区二区三区四区四| 精品福利一区| 国产国产精品久久久久|