日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]基于頻繁子樹來導出記錄模板的方法有效

專利信息
申請?zhí)枺?/td> 201110245084.1 申請日: 2011-08-16
公開(公告)號: CN102955796A 公開(公告)日: 2013-03-06
發(fā)明(設計)人: 徐鵬;陳正 申請(專利權)人: 微軟公司
主分類號: G06F17/30 分類號: G06F17/30
代理公司: 上海專利商標事務所有限公司 31100 代理人: 胡利鳴;陸嘉
地址: 美國華*** 國省代碼: 美國;US
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 基于 頻繁 子樹 導出 記錄 模板 方法
【權利要求書】:

1.一種用于從網(wǎng)頁中導出數(shù)據(jù)記錄模板(data?record?template)的方法,所述方法包括:

從網(wǎng)頁中挖掘最大頻繁子樹(maximal?frequent?subtree)和閉合頻繁子樹(closed?frequent?subtree),包括:

計算頻繁1-子樹(frequent-1subtree),所述頻繁1-子樹是網(wǎng)頁的文檔對象模型DOM(document?object?model)樹中僅具有一個節(jié)點的頻繁子樹;

基于所述頻繁1-子樹,通過最右擴展來枚舉按頻繁排序的導出的子樹,所述最右擴展包括通過迭代地將新的子樹附加到頻繁子樹的最右分支上的節(jié)點來增長頻繁子樹;

將所有導出的子樹區(qū)分為最大頻繁子樹和閉合頻繁子樹,其中導出的子樹按頻繁排序;

對從網(wǎng)頁挖掘出的最大頻繁子樹和閉合頻繁子樹進行分組;

在分組內(nèi)標識模板子樹(TEN),所述模板子樹是僅包括所有必要節(jié)點的模板,基于模板子樹來標識可選節(jié)點并消除噪音;以及

基于模板子樹從各個節(jié)點中抽取結構化數(shù)據(jù),以導出數(shù)據(jù)記錄模板。

2.如權利要求1所述的方法,其特征在于,所導出的數(shù)據(jù)記錄模板是針對所述網(wǎng)頁的主數(shù)據(jù)記錄列表的數(shù)據(jù)記錄模板。

3.如權利要求1所述的方法,其特征在于,消除噪音進一步包括消除數(shù)據(jù)記錄列表周圍的噪音。

4.如權利要求1所述的方法,其特征在于,對從網(wǎng)頁挖掘出的最大頻繁子樹和閉合頻繁子樹進行分組進一步包括基于最大頻繁子樹和閉合頻繁子樹之間的所屬關系進行分組,使得各個分組包括一最大頻繁子樹和多個閉合頻繁子樹。

5.如權利要求4所述的方法,其特征在于,在分組內(nèi)標識模板子樹進一步包括對分組內(nèi)的各個最大頻繁子樹和閉合頻繁子樹計算一加權度量,其中具有最高加權度量的最大頻繁子樹或閉合頻繁子樹被標識為所述模板子樹。

6.如權利要求1所述的方法,其特征在于,所述可選節(jié)點包括最大頻繁子樹中的下述節(jié)點:所述模板子樹內(nèi)不具有與該節(jié)點相匹配的節(jié)點。

7.如權利要求5所述的方法,其特征在于,基于模板子樹從各個節(jié)點中抽取結構化數(shù)據(jù)進一步包括將其分組內(nèi)的具有最大加權度量的頻繁子樹是相同的最大頻繁子樹對齊來標識從中可抽取結構化數(shù)據(jù)的節(jié)點。

8.如權利要求7所述的方法,其特征在于,所述從中可抽取結構化數(shù)據(jù)的節(jié)點包括在頻繁子樹內(nèi)具有相同的兄弟節(jié)點和父節(jié)點但從不在一起出現(xiàn)來作為DOM樹中的節(jié)點的子節(jié)點的可選節(jié)點。

9.一種用于挖掘子樹結構的方法,所述方法包括:

計算頻繁1-子樹,所述頻繁1-子樹是網(wǎng)頁的文檔對象模型DOM樹中僅具有一個節(jié)點的頻繁子樹;

基于所述頻繁1-子樹,通過最右擴展來枚舉按頻繁排序的導出的子樹,所述最右擴展包括通過迭代地將新的子樹附加到頻繁子樹的最右分支上的節(jié)點來增長頻繁子樹;

將所有導出的子樹區(qū)分為最大頻繁子樹和閉合頻繁子樹,其中導出的子樹按頻繁排序。

10.如權利要求9所述的方法,其特征在于,計算頻繁1-子樹進一步包括使用標簽路徑來計算頻繁1-子樹,其中樹中一節(jié)點的標簽路徑是從該樹的根部到該節(jié)點的一系列節(jié)點。

11.如權利要求9所述方法,其特征在于,將所有導出的子樹區(qū)分為最大頻繁子樹和閉合頻繁子樹進一步包括使用基于出現(xiàn)的支持來區(qū)分一頻繁子樹是閉合頻繁子樹還是最大頻繁子樹。

12.一種用于從子樹結構得出數(shù)據(jù)記錄模板的方法,所述方法包括:

對從網(wǎng)頁挖掘出的最大頻繁子樹和閉合頻繁子樹進行分組;

在分組內(nèi)標識模板子樹(TEN),所述模板子樹是僅包括所有必要節(jié)點的模板,基于模板子樹來標識可選節(jié)點并消除噪音;以及

基于模板子樹從各個節(jié)點抽取結構化數(shù)據(jù),以得出數(shù)據(jù)記錄模板。

13.如權利要求12所述的方法,其特征在于,最大頻繁子樹和閉合頻繁子樹是從所述網(wǎng)頁的文檔對象模型DOM樹中挖掘的。

14.如權利要求12所述的方法,其特征在于,消除噪音進一步包括消除數(shù)據(jù)記錄列表周圍的噪音。

下載完整專利技術內(nèi)容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于微軟公司,未經(jīng)微軟公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201110245084.1/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產(chǎn)權局專利說明書;

2、支持發(fā)明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標識 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 国产一区午夜| 狠狠躁夜夜躁2020| 亚洲欧美色图在线| 亚洲精品国产精品国自| 中文丰满岳乱妇在线观看| 四虎影视亚洲精品国产原创优播| 国产欧美一区二区三区沐欲| 91超薄丝袜肉丝一区二区| 国产精品区一区二区三| 国产午夜精品一区二区理论影院 | 国产69精品久久久久男男系列| 91国产一区二区| 免费观看又色又爽又刺激的视频| 国产精品一区二区毛茸茸| 国产主播啪啪| 9999国产精品| 国产性猛交96| 国产精品久久久久久一区二区三区 | 亚洲精品91久久久久久| 国产片91| 久久午夜精品福利一区二区 | 亚洲欧美日本一区二区三区| 国产综合久久精品| 美女直播一区二区三区| 亚洲欧美国产精品一区二区 | 丰满岳乱妇在线观看中字| 久久久一二区| 精品91av| 国产又黄又硬又湿又黄| 日本一二三四区视频| 中文字幕在线一区二区三区| 日韩av在线播放网址| 国产一区影院| 久久99中文字幕| 午夜av片| 国产在线一区二区视频| 狠狠色噜噜狠狠狠狠| 国产大片一区二区三区| 99re热精品视频国产免费| 国产品久精国精产拍| 十八无遮挡| 日韩精品中文字幕久久臀| 97国产精品久久| 欧美日韩一区二区三区四区五区 | 91亚洲国产在人线播放午夜| 欧美日韩一二三四区| 日本aⅴ精品一区二区三区日| 欧美日韩偷拍一区| 欧美日韩中文不卡| 午夜肉伦伦| 91亚洲欧美强伦三区麻豆| 亚洲欧美色图在线| 国产一区二区视频播放| 国产aⅴ精品久久久久久| 欧美日韩中文不卡| 亚洲网站久久| 2020国产精品自拍| 大伊人av| 午夜av免费看| 久久精品国产精品亚洲红杏| 日本免费电影一区二区| 一区二区国产盗摄色噜噜| 中文字幕欧美日韩一区| 欧美一区二区三区片| 26uuu亚洲国产精品| 欧美日本一二三区| 午夜精品在线观看| 国产一级片大全| 91一区在线| 狠狠色成色综合网| 久久国产麻豆| 久久久久国产精品免费免费搜索| 日韩精品一区二区中文字幕| 国产伦理久久精品久久久久| 欧美精品五区| 久久国产欧美一区二区三区免费| 国产一级片子| av午夜影院| 日韩欧美中文字幕精品| 亚洲精品一区,精品二区| 久久网站精品| 久久不卡一区| 中文字幕一区二区三区乱码视频| av午夜剧场| 国产一区观看| www亚洲精品| 精品国精品国产自在久不卡| 国产欧美一区二区在线| 97国产精品久久| 亚洲一区中文字幕| 国产亚洲精品久久午夜玫瑰园| 999久久国精品免费观看网站| 中文字幕制服狠久久日韩二区| 国产一区亚洲一区| 91精品国模一区二区三区| 久久精品麻豆| 日韩av三区| 国产aⅴ精品久久久久久| 香蕉av一区| 欧美一区免费| 国产一区网址| 456亚洲精品| 久久99精品国产麻豆婷婷| 国产日韩麻豆| 色婷婷综合久久久中文一区二区| 久久精品国语| 国产女人好紧好爽| 亚洲v欧美v另类v综合v日韩v| 99精品国产一区二区三区不卡| 午夜三级大片| 国产精品视频一区二区二| 中文字幕日韩有码| 欧美日韩一区二区三区精品| 国产欧美日韩二区| 亚洲欧美制服丝腿| 日韩av中文字幕第一页| 欧美国产一区二区三区激情无套| 国产欧美一区二区三区沐欲 | 国产精品亚洲二区| 91国内精品白嫩初高生| 亚洲国产日韩综合久久精品| 片毛片免费看| 扒丝袜网www午夜一区二区三区| 国产欧美日韩精品一区二区三区| 一区二区精品久久| 少妇性色午夜淫片aaa播放5| 日韩国产精品一区二区| 欧美精品五区| 国产精品入口麻豆九色| 欧美激情片一区二区| 午夜影院啪啪| 国产精品黑色丝袜的老师| 亚洲四区在线观看| 亚洲国产精品综合| 99国产精品免费| 日本精品一区二区三区在线观看视频| 国产日韩欧美在线一区| 亚洲制服丝袜中文字幕| 国产精品视频1区| 欧美一区二区三区性| 亚洲国产精品入口| 欧美激情在线免费| 国产二区免费视频| 久99久精品| 亚洲国产精品区| 久久艹国产精品| 曰韩av在线| 欧美一区二区综合| 国产二区三区视频| 欧美一级久久精品| 91社区国产高清| 精品99在线视频| 一区二区三区在线影院| 黄色91在线观看| 香港日本韩国三级少妇在线观看 | 国产精品二区一区| 国产1区2区3区中文字幕| 蜜臀久久99精品久久一区二区| 国产精彩视频一区二区| 激情久久综合| 扒丝袜pisiwa久久久久| 国产精品国产三级国产专区51区| 亚洲欧美一区二区三区不卡| 中文乱幕日产无线码1区| 国产精品久久久视频| 日韩av中文字幕在线免费观看| 亚洲码在线| 久久精品视频中文字幕| 久久er精品视频| 一区二区三区四区中文字幕| 久久夜靖品2区| 久久人人97超碰婷婷开心情五月| 亚洲国产精品二区| 亚洲欧美国产精品久久| 羞羞视频网站免费| 久久99精品国产| **毛片在线| 欧美精品在线一区二区| 亚洲精品乱码久久久久久蜜糖图片| 日本午夜无人区毛片私人影院| 久久久久偷看国产亚洲87| 91超碰caoporm国产香蕉| 国产精品理人伦一区二区三区| 精品国产一区二区三区在线| 日韩中文字幕亚洲欧美| 久久久久久久国产| 国产精品久久久久久久久久久不卡| 日本aⅴ精品一区二区三区日| 人人澡超碰碰97碰碰碰| 李采潭伦理bd播放| 99精品一区二区| 国产二区不卡| 久久国产精品麻豆| 国产麻豆一区二区三区精品| 国产精品视频免费看人鲁| 国产一区免费播放| 国产精品你懂的在线| 久久99精品国产麻豆宅宅| 91一区在线观看| 欧美一区二区三区爽大粗免费| 久久狠狠高潮亚洲精品| 欧美日韩一级二级| 国产88av| 99欧美精品| 99精品少妇| 久久精品麻豆| 国产精品久久久久久久久久不蜜臀| 久久精视频| 欧美精品一级二级| 日韩av免费电影| 国产一区二区视频播放| 91av精品| 欧美日韩一卡二卡| 国产极品一区二区三区| 欧美精品日韩精品| 一区二区三区精品国产| 欧美日韩九区| 国产日韩欧美中文字幕| 亚洲va国产2019| 久久精品综合视频| 国产一区免费在线观看| 少妇bbwbbwbbw高潮| 欧美午夜一区二区三区精美视频| 国产精品久久久区三区天天噜| 国产日韩欧美亚洲| 国产在线观看免费麻豆| 国产精品一级在线| 欧美黄色片一区二区| 国产午夜精品免费一区二区三区视频 | 中文字幕在线视频一区二区| av午夜剧场| 国产网站一区二区| 欧美一区久久久| 午夜免费网址| 亚洲视频精品一区 | 激情久久综合| 国产性猛交96| 国产精品一区一区三区| 男女无遮挡xx00动态图120秒| 欧美精品九九| 狠狠躁夜夜躁xxxxaaaa| 色乱码一区二区三在线看| 香蕉视频一区二区三区| 亚洲精品一区二区三区98年| 亚洲国产精品国自产拍久久| 日本一级中文字幕久久久久久|