日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專(zhuān)利]用于深層網(wǎng)頁(yè)數(shù)據(jù)源集成的數(shù)據(jù)源發(fā)現(xiàn)方法有效

專(zhuān)利信息
申請(qǐng)?zhí)枺?/td> 200710021883.4 申請(qǐng)日: 2007-05-09
公開(kāi)(公告)號(hào): CN101051313A 公開(kāi)(公告)日: 2007-10-10
發(fā)明(設(shè)計(jì))人: 崔志明;趙朋朋;方巍 申請(qǐng)(專(zhuān)利權(quán))人: 崔志明;趙朋朋;方巍
主分類(lèi)號(hào): G06F17/30 分類(lèi)號(hào): G06F17/30
代理公司: 蘇州創(chuàng)元專(zhuān)利商標(biāo)事務(wù)所有限公司 代理人: 陶海鋒
地址: 215001江蘇省*** 國(guó)省代碼: 江蘇;32
權(quán)利要求書(shū): 查看更多 說(shuō)明書(shū): 查看更多
摘要:
搜索關(guān)鍵詞: 用于 深層 網(wǎng)頁(yè) 數(shù)據(jù)源 集成 發(fā)現(xiàn) 方法
【說(shuō)明書(shū)】:

技術(shù)領(lǐng)域

發(fā)明涉及一種基于網(wǎng)絡(luò)的數(shù)據(jù)源的發(fā)現(xiàn)方法,具體涉及一種由網(wǎng)絡(luò)查詢(xún)接口連接的深層網(wǎng)頁(yè)的數(shù)據(jù)源發(fā)現(xiàn)方法,用于深層網(wǎng)頁(yè)數(shù)據(jù)源的集成。

背景技術(shù)

隨著網(wǎng)絡(luò)數(shù)據(jù)庫(kù)的廣泛應(yīng)用,網(wǎng)絡(luò)正在加速“深化”。互聯(lián)網(wǎng)上有大量頁(yè)面是由后臺(tái)數(shù)據(jù)庫(kù)動(dòng)態(tài)產(chǎn)生,這部分信息不能直接通過(guò)靜態(tài)鏈接獲取,只能通過(guò)填寫(xiě)表單提交查詢(xún)來(lái)獲取,由于傳統(tǒng)的網(wǎng)絡(luò)爬蟲(chóng)(Crawler)不具有填寫(xiě)表單的能力,無(wú)法獲取這些頁(yè)面。因此,現(xiàn)有的搜索引擎搜索不出這部分頁(yè)面信息,從而導(dǎo)致這部分信息對(duì)用戶(hù)是隱藏、不可見(jiàn)的,我們稱(chēng)之為深層網(wǎng)絡(luò)頁(yè)面(Deep?Web,又稱(chēng)為Invisible?Web,Hidden?Web)。Deep?Web是一個(gè)與SurfaceWeb相對(duì)應(yīng)的概念,最初由Dr.Jill?Ellsworth于1994年提出,指那些由普通搜索引擎難以發(fā)現(xiàn)其信息內(nèi)容的網(wǎng)絡(luò)頁(yè)面。Deep?Web信息一般存儲(chǔ)在數(shù)據(jù)庫(kù)中,和靜態(tài)頁(yè)面相比通常信息量更大,主題更專(zhuān)一,信息質(zhì)量更好,信息結(jié)構(gòu)化更好,增長(zhǎng)速度更快。研究表明,Deep?Web信息是Surface?Web信息的500倍,有近450,000個(gè)Deep?Web站點(diǎn)。實(shí)現(xiàn)大規(guī)模Deep?Web數(shù)據(jù)集成是方便用戶(hù)使用Deep?Web信息的一個(gè)有效途徑。

要實(shí)現(xiàn)大規(guī)模Deep?Web集成搜索,需要解決:1)數(shù)據(jù)源發(fā)現(xiàn)(Deep?WebDiscovery);2)查詢(xún)接口抽取(Query?Interface?Extraction);3)數(shù)據(jù)源分類(lèi)(Source?Classification);4)查詢(xún)轉(zhuǎn)換(Query?Transfer);5)結(jié)果合成(ResultMerging)等五個(gè)關(guān)鍵問(wèn)題。

對(duì)Deep?Web進(jìn)行分類(lèi)集成搜索的前提是獲取Deep?Web查詢(xún)接口,這屬于數(shù)據(jù)源發(fā)現(xiàn)的范疇。

K.C.-C.Chang,B.He,Z.Zhang在Toward?Large-Scale?Integration:Building?a?MetaQuerier?over?Databases?on?the?Web一文中(Conference?onInnovative?Data?Systems?Research,Asilomar,2005),公開(kāi)了一種從網(wǎng)絡(luò)中獲取查詢(xún)接口的方法,其首先收集提供WWW服務(wù)的IP地址列表,然后對(duì)于列表中每個(gè)IP地址,按照寬度優(yōu)先策略依次抓取一定深度范圍內(nèi)的網(wǎng)頁(yè),并從下載的頁(yè)面中提取可查詢(xún)接口。但是,由于互聯(lián)網(wǎng)中含有查詢(xún)接口的頁(yè)面比例很小,而寬度優(yōu)先是一種盲目的搜索策略,采用這種方法會(huì)下載大量無(wú)關(guān)的頁(yè)面,效率非常低。

解決這個(gè)問(wèn)題的有效手段是采用聚焦爬行(Focused?Crawling)技術(shù)。目前把聚焦爬蟲(chóng)技術(shù)應(yīng)用到Deep?Web數(shù)據(jù)源發(fā)現(xiàn)中的研究還比較少。有學(xué)者使用鏈接分類(lèi)器來(lái)優(yōu)先下載那些最可能指向含有查詢(xún)接口的頁(yè)面。在訓(xùn)練分類(lèi)器過(guò)程中,其使用Google等搜索引擎來(lái)得到指向內(nèi)層頁(yè)面的所有外層頁(yè)面,但是這種方法的缺點(diǎn)是:越到外層,頁(yè)面的數(shù)量就越多,并且很多是無(wú)關(guān)的頁(yè)面,所以會(huì)造成“主題漂移”等問(wèn)題。而且上述方法無(wú)法得到某頁(yè)面在其所屬站點(diǎn)中準(zhǔn)確的深度信息,從而無(wú)法很好地控制爬行的進(jìn)程。

發(fā)明內(nèi)容

本發(fā)明目的是提供一種用于深層網(wǎng)頁(yè)數(shù)據(jù)源集成的數(shù)據(jù)源發(fā)現(xiàn)方法,以根據(jù)所設(shè)定的主題,實(shí)現(xiàn)主題相關(guān)的數(shù)據(jù)查詢(xún)接口的檢索下載,減小頁(yè)面下載數(shù)量,解決主題漂移問(wèn)題。

為達(dá)到上述目的,本發(fā)明采用的技術(shù)方案是:一種用于深層網(wǎng)頁(yè)數(shù)據(jù)源集成的數(shù)據(jù)源發(fā)現(xiàn)方法,包括下列步驟:

(1)提供待查詢(xún)數(shù)據(jù)的主題,分別構(gòu)建站點(diǎn)根鏈接隊(duì)列和本地鏈接隊(duì)列,在站點(diǎn)根鏈接隊(duì)列中放入至少一個(gè)種子根鏈接地址,并根據(jù)其與主題的關(guān)系給定權(quán)重;

(2)如果本地鏈接隊(duì)列為空,則從站點(diǎn)根鏈接隊(duì)列中取權(quán)重最大的一個(gè)根鏈接地址,放入本地鏈接隊(duì)列中;從本地鏈接隊(duì)列中取評(píng)分最高的頁(yè)面鏈接,由爬行模塊下載該頁(yè)面;

(3)利用表單分類(lèi)器對(duì)步驟(2)下載的頁(yè)面進(jìn)行處理,如其中含有表單查詢(xún)接口,則將其加入深層網(wǎng)頁(yè)數(shù)據(jù)源中;

(4)利用頁(yè)面分類(lèi)器對(duì)步驟(2)下載的頁(yè)面進(jìn)行處理,所述頁(yè)面分類(lèi)器采用最優(yōu)者優(yōu)先(best-first)策略進(jìn)行主題判斷,如果主題評(píng)分小于設(shè)定閾值,則返回步驟(2);

下載完整專(zhuān)利技術(shù)內(nèi)容需要扣除積分,VIP會(huì)員可以免費(fèi)下載。

該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于崔志明;趙朋朋;方巍,未經(jīng)崔志明;趙朋朋;方巍許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/200710021883.4/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。

×

專(zhuān)利文獻(xiàn)下載

說(shuō)明:

1、專(zhuān)利原文基于中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局專(zhuān)利說(shuō)明書(shū);

2、支持發(fā)明專(zhuān)利 、實(shí)用新型專(zhuān)利、外觀設(shè)計(jì)專(zhuān)利(升級(jí)中);

3、專(zhuān)利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專(zhuān)利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級(jí)為極速版,下載速度顯著提升!歡迎使用!

請(qǐng)您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊(cè)】

關(guān)于我們 尋求報(bào)道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識(shí) 聯(lián)系我們

鉆瓜專(zhuān)利網(wǎng)在線咨詢(xún)

周一至周五 9:00-18:00

咨詢(xún)?cè)诰€客服咨詢(xún)?cè)诰€客服
tel code back_top
主站蜘蛛池模板: av素人在线| 日韩av中文字幕第一页| 日韩精品免费一区二区夜夜嗨| 亚洲精品丝袜| 99er热精品视频国产| 99国产精品欧美久久久久的广告| 欧美一区二区三区艳史| 日本一区二区三区中文字幕| 欧美日韩精品中文字幕| 国产欧美亚洲精品| 久久艹国产精品| 欧美日韩三区二区| 天天干狠狠插| 久久人人精品| 亚洲激情中文字幕| 91精品啪在线观看国产线免费| 激情欧美一区二区三区| 制服丝袜二区| 中文字幕在线一二三区| 亚洲欧美一区二区三区1000| 狠狠色很很在鲁视频| 少妇高潮一区二区三区99小说| 中文字幕在线视频一区二区| 国产全肉乱妇杂乱视频在线观看| 日本三级韩国三级国产三级| 国产精品一区一区三区| 扒丝袜网www午夜一区二区三区| 高清欧美精品xxxxx| 久久99亚洲精品久久99| 欧美日韩中文不卡| 日本精品一二三区| 亚洲精品久久久久久动漫| 国产一区不卡视频| 一区二区精品在线| 欧美精品一区二区三区四区在线| 精品国产91久久久久久久| 国产一区二区视频免费在线观看 | 国产精品19乱码一区二区三区| 日本护士hd高潮护士| 国产一二三区免费| 99久久夜色精品国产网站| 国产午夜亚洲精品午夜鲁丝片 | 91久久精品国产亚洲a∨麻豆| 国产精品一二三四五区| 狠狠躁夜夜| 国产欧美一区二区三区精品观看| 精品国产一区二区三区久久久久久| 国产精品日韩精品欧美精品 | 欧美精品日韩| 久久99精品久久久久国产越南| 日韩av在线播| 日韩国产精品一区二区| 国产suv精品一区二区4| 自拍偷在线精品自拍偷写真图片| 思思久久96热在精品国产| ass韩国白嫩pics| 国产资源一区二区三区| 911久久香蕉国产线看观看| 欧美一区二区三区爽大粗免费| 日本精品99| 欧美国产在线看| 午夜电影毛片| 日韩精品一区二区中文字幕| 国产精品日韩电影| 国产一区二| 久免费看少妇高潮a级特黄按摩| 日韩精品一区二区三区免费观看| 对白刺激国产对白精品城中村| 97久久精品人人做人人爽50路| 欧美中文字幕一区二区三区| 浪潮av网站| 午夜电影三级| 日韩av在线播| 欧美freesex极品少妇| 男女视频一区二区三区| 鲁丝一区二区三区免费| 大伊人av| av午夜影院| 亚洲欧美国产中文字幕| 处破大全欧美破苞二十三| 久久免费视频一区| 精品国产一区二| 福利片91| 久久久久久久国产| 91久久一区二区| 美日韩一区| 91久久精品国产91久久性色tv| 国产精品美女www爽爽爽视频| 日韩精品一区二区免费| 国产一区二区免费在线| 正在播放国产一区二区| 国产91一区| 久久激情影院| 日韩中文字幕亚洲欧美| 国久久久久久| 国产精品第157页| 国产综合亚洲精品| 久久久精品久久日韩一区综合| 日韩av在线播放网址| 国产精品久久免费视频在线| 一区二区三区国产精华| 国产精品一区二区av麻豆| 午夜欧美a级理论片915影院| 麻豆9在线观看免费高清1| 国产一区欧美一区| 年轻bbwwbbww高潮| 国产伦精品一区二区三区四区| 国产精品久久免费视频在线| 一区二区三区电影在线观看| 三上悠亚亚洲精品一区二区| 国产亚洲精品久久午夜玫瑰园 | 亚洲精品乱码久久久久久写真| 26uuu亚洲国产精品| 国产女人和拘做受在线视频| 国产精品二区在线| 日韩中文字幕在线一区二区| 国产男女乱淫真高清视频免费| 欧美在线视频二区| 一区二区三区四区中文字幕| 狠狠躁狠狠躁视频专区| 91看片app| 欧美精品日韩| 久久综合久久自在自线精品自| 国产精品久久久久免费a∨大胸| 日本三级香港三级| 99久久婷婷国产综合精品草原| 久久99久久99精品免观看软件 | 久久精品视频一区二区| 亚日韩精品| 国产精品综合一区二区三区| 久久精品综合视频| 国产91免费在线| 高清欧美精品xxxxx| 色婷婷综合久久久中文一区二区| 欧美精品一区二区久久久| 国产高清一区二区在线观看| 国产精一区二区三区| 午夜色大片| 国产精品久久久久四虎| 国产乱码精品一区二区三区介绍| 久久国产精品二区| 免费久久99精品国产婷婷六月| 国产亚洲精品久久19p| 国产日韩欧美三级| 国产69精品久久777的优势| 午夜国产一区| 久久一二区| 欧美日韩国产免费观看| 日韩av在线影院| 性欧美一区二区三区| 国产区一二| 少妇久久精品一区二区夜夜嗨 | 69久久夜色精品国产7777| 久久国产精品二区| 国产精品久久久久免费a∨大胸| 欧美一区二区三区久久精品视| 国产一区二区午夜| 欧美日韩九区| 色一情一乱一乱一区免费网站| 国产精品亚洲а∨天堂123bt| 制服丝袜二区| 欧美一区二区三区久久精品视 | 99国产精品| 国产99久久九九精品| 国产一区二区在线精品| 久久青草欧美一区二区三区| 日韩精品一区在线观看| 精品国产亚洲一区二区三区| 999亚洲国产精| 免费观看又色又爽又刺激的视频| 少妇太爽了在线观看免费| 亚洲精品国产综合| 久久99久国产精品黄毛片入口| 欧美大成色www永久网站婷| 欧美精品日韩| 国产一卡二卡在线播放| 国产一级精品在线观看| 男人的天堂一区二区| 久久久精品欧美一区二区| 韩国视频一区二区| 91偷自产一区二区三区精品| 精品久久久久久亚洲综合网 | 国产黄一区二区毛片免下载| 国产欧美精品一区二区在线播放| 日本一二三区电影| 国产一区二区播放| 久久一区二区三区视频| aaaaa国产欧美一区二区| 午夜黄色网址| 久久午夜无玛鲁丝片午夜精品| 久久一区二区精品| 国产精品一区二区不卡| 久久久久久久亚洲国产精品87| 四虎影视亚洲精品国产原创优播| 国产在线观看二区| 91精品视频在线观看免费| 国产精品国精产品一二三区| 精品国产乱码久久久久久图片| 国产精品一二二区| 久久99精品一区二区三区| 亚洲高清毛片一区二区| 夜夜躁人人爽天天天天大学生| 国产欧美精品一区二区三区-老狼 国产精品一二三区视频网站 | 国产精品日本一区二区不卡视频 | 国产一二区在线| 大bbw大bbw巨大bbw看看 | 海量av在线| 欧美日韩一区电影| 欧美一区二区三区久久综合| 99er热精品视频国产| 欧美日韩一区二区三区四区五区| 欧美精品日韩| 欧美日韩国产在线一区| 久久综合久久自在自线精品自| 91亚洲精品国偷拍自产| 国产精品一区二区久久乐夜夜嗨| 国产日韩欧美自拍| 四虎国产精品永久在线国在线| free性欧美hd另类丰满| 国产特级淫片免费看| 91理论片午午伦夜理片久久| 国产精品综合一区二区三区| 欧美黄色片一区二区| 一区二区三区电影在线观看| 久久精品一二三四| 国产一区二区电影在线观看| 日本一区中文字幕| 国产偷久久一区精品69| 国产69精品久久久久孕妇不能看 | 88国产精品视频一区二区三区| 日韩午夜电影院| 97人人澡人人添人人爽超碰| 国产69精品久久久久777糖心| 国产精品久久久久久一区二区三区| **毛片免费| 午夜国产一区二区| 亚洲精品老司机| 久久综合伊人77777麻豆最新章节| 销魂美女一区二区| 午夜精品99| 国产91精品高清一区二区三区| 91福利视频导航| av国产精品毛片一区二区小说| 国产精品国精产品一二三区| 中文字幕欧美久久日高清| av午夜剧场|