日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]形成用于生成文檔模板的合并樹的方法以及裝置有效

專利信息
申請號: 201010260747.2 申請日: 2010-08-17
公開(公告)號: CN102375847A 公開(公告)日: 2012-03-14
發明(設計)人: 王新文;夏迎炬;孟遙;于浩 申請(專利權)人: 富士通株式會社
主分類號: G06F17/30 分類號: G06F17/30
代理公司: 北京集佳知識產權代理有限公司 11227 代理人: 王萍;許向華
地址: 日本神*** 國省代碼: 日本;JP
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 形成 用于 生成 文檔 模板 合并 方法 以及 裝置
【說明書】:

技術領域

發明總體上涉及計算機領域,更具體而言,涉及形成用于生成文檔模板的合并樹的方法以及裝置。

背景技術

隨著因特網和電子技術的飛速發展,人們不再受地域的限制,可以方便的在網上交換各種各樣的信息。在大量用戶的參與之下,網站(比如論壇、博客、產品目錄網站等)的網頁中存在大量的有用信息,這些信息不僅對于個人而且對于企業都有很好的使用價值。

為了獲得這些有用信息,需要下載網站中所包括的多個網頁以進行進一步的分析提取。

對于同一個網站的網頁,大多數都具有相似的結構和組成,如果使用這些頁面的模板,那么去除噪音后提取其中的有用信息,就會變得簡單而精確。其中,如何生成正確的模板就成為其中的關鍵所在。

而且,原來的模板生成通常是通過手工來實現的,但是由于站點的眾多以及站點模板的變化,使得生成和長期維護一個模板成為一件費時而且費力的工作。

發明內容

針對上述情況,本發明的目的是提出一種通過對由多個頁面解析成的多棵樹進行比較和合并來形成合并樹的方法,以提高使用合并樹生成模板的準確率。

此外,本發明的另一目的是提出一種通過對合并樹根據節點的特征進行歸納和提取來生成站點網頁的模板的方法,以使得模板的生產變得簡單。

按照本發明的一方面,提供了一種形成用于生成文檔模板的合并樹的方法,包括以下步驟:

相似度計算步驟,用于當從由多個頁面解析成的多棵樹中每顆樹與另一顆樹進行比較時計算兩顆被比樹中位于同一層的子樹的相似度,以從兩顆被比樹中提取相似度大于或等于預定第一閾值的相似子樹和該些相似子樹的公共根節點,其中從所述多棵樹的節點能夠提取所需特征;

合并步驟,使用提取的所有樹的相似子樹來形成初始合并樹,其中初始合并樹的根節點是所有樹的相似子樹的公共根節點;以及

后處理步驟,用于對初始合并樹進行后處理,以通過去除初始合并樹的無效子樹來獲得合并樹。

按照本發明的一方面,提供了一種形成用于生成文檔模板的合并樹的裝置,包括:

相似度計算單元,配置成當從由多個頁面解析成的多棵樹中每顆樹與另一顆樹進行比較時計算兩顆被比樹中位于同一層的子樹的相似度,以從兩顆被比樹中提取相似度大于或等于預定第一閾值的相似子樹和該些相似子樹的公共根節點,其中從所述多棵樹的節點能夠提取所需特征;

合并單元,配置成使用提取的所有樹的相似子樹來形成初始合并樹,其中初始合并樹的根節點是所有樹的相似子樹的公共根節點;以及

后處理單元,配置成對初始合并樹進行后處理,以通過去除初始合并樹的無效子樹來獲得合并樹。

根據本發明實施例的方法和裝置可獲得的一個益處是,通過合并由多個頁面解析成的多棵樹得到用于生成模板的合并樹,能夠提高生成模板的準確率。進一步,通過對合并樹根據節點的特征進行歸納和提取,能夠降低因為頁面中的一些微小變化而導致生成錯誤模板的風險。此外,通過對一些參數的改變,可以提高不同情況下的準確率。可獲得的另外益處是,通過對多個頁面的歸納,可以明確地發現模板路徑中容易發生變化的節點,通過把這些節點變化信息添加到路徑模板中,可以減少以后提取信息的時間消耗和增加提取信息的準確率,從而增加了生成模板的靈活性。可獲得的又一益處是,根據節點的特征進行信息路徑的歸納和提取,使得模板的生產變得自動而簡單,而且能夠通過對抽取結果和原來存儲結果的對比,從而及時發現其中的改變并修改發生變化的模板。

附圖說明

從對說明本發明的主旨及其使用的優選實施例和附圖的以下描述來看,本發明的以上和其它目的、特點和優點將是易明白的。附圖中的部件不一定成比例繪制,而只是為了示出本發明的原理。為了便于示出和描述本發明的一些部分,附圖中對應部分可能被放大,即,使其相對于在依據本發明的示例性裝置中的其它部件變得更大。在附圖中,相同的或類似的技術特征或部件將采用相同或類似的附圖標記來表示。

圖1是示出了根據本發明實施例的用于生成文檔模板的合并樹的形成方法的流程簡圖;

圖2是示出了應用圖1所示方法的一個具體例子的流程簡圖;

圖3是示出了在如圖1所示實施例的方法的一個具體示例中所應用的相似度計算步驟的流程簡圖;

圖4是示出了在如圖1所示的實施例的方法的一個具體示例中所應用的后處理步驟的流程簡圖;

圖5是示出了根據本發明的實施例的形成用于生成文檔模板的合并樹的裝置的簡化框圖;以及

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于富士通株式會社,未經富士通株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201010260747.2/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 精品一区二区在线视频| 国产一区二区三区的电影| 国产精品19乱码一区二区三区 | 午夜少妇性影院免费观看| 国产乱一区二区三区视频| 少妇久久免费视频| 国产精一区二区三区| 综合久久激情| 高清欧美xxxx| 免费久久99精品国产婷婷六月| 在线国产91| 久久国产免费视频| a级片一区| 99国产伦精品一区二区三区 | 免费精品一区二区三区第35| 中文字幕一区二区三区不卡| 欧美激情精品久久久久久免费| 国产在线不卡一| 欧美高清xxxxx| 国产一级大片| 88888888国产一区二区| 香港三日本三级三级三级| 亚洲国产精品女主播| 精品久久综合1区2区3区激情| 99久久精品免费视频| 国产伦高清一区二区三区 | xxxx18日本护士高清hd| 国产男女乱淫视频高清免费| 欧美日韩国产精品一区二区亚洲| 国产一区二区三区乱码| 91精品一区二区中文字幕| 欧美一区二区在线不卡| 亚洲一二三在线| 91精品国产高清一二三四区| av午夜剧场| av中文字幕一区二区| 亚洲欧美一区二区三区1000| 狠狠色狠狠色综合日日2019| 九色国产精品入口| 欧美日韩一级二级| 日本免费电影一区二区| 不卡在线一区二区| 97国产精品久久久| 最新国产精品自拍| 中文天堂在线一区| 国产999久久久| 国产麻豆91欧美一区二区| 国产午夜伦理片| 欧美激情精品一区| 99久热精品| 91超薄丝袜肉丝一区二区| 国产伦精品一区二| 欧美一区二区性放荡片| 国产精品电影一区二区三区| 国产一区在线免费观看| 麻豆国产一区二区| 欧美一级日韩一级| 国产精品欧美一区二区三区| 国产69精品久久久久app下载| 欧美一区二区三区免费播放视频了| 国产白丝一区二区三区| 亚洲理论影院| 午夜亚洲国产理论片一二三四| 91久久国产露脸精品国产 | 国产精品久久久久久久久久久久久久久久久久| 日本高清不卡二区| 欧美精品亚洲一区| 国产精品一区二区不卡| 国产精品不卡一区二区三区| xxxxhd欧美| 亚洲一区欧美| 精品国产一区二区三区四区vr| 国产精品美女久久久免费| 一区二区在线视频免费观看| 久久久精品免费看| 国产1区2区3区中文字幕| 久久99久久99精品免观看软件 | 国产欧美精品一区二区三区小说| 国产精品偷拍| 天天射欧美| 欧美乱妇高清无乱码一级特黄| 日本二区在线观看| 国产一区影院| 91精品福利在线| 国产偷亚洲偷欧美偷精品| 久久精品色欧美aⅴ一区二区| 91看片淫黄大片91| 久久国产精彩视频| 91久久国产视频| 国产91久久久久久久免费| 中文字幕av一区二区三区高| 久久99精品久久久久国产越南| 欧美一级久久精品| 91狠狠操| 中文字幕一区二区三区免费视频| 在线精品国产一区二区三区88| 国产精品久久久久激情影院| 99精品久久99久久久久| 精品一区中文字幕| 国产午夜精品一区二区三区在线观看| 欧美一区二三区人人喊爽| 麻豆视频免费播放| 国产精品视频十区| 少妇中文字幕乱码亚洲影视| 欧美一区二区三区激情在线视频| 日韩电影在线一区二区三区| 91免费国产视频| 国产91视频一区| 国产专区一区二区| 最新国产一区二区| 久久人做人爽一区二区三区小说 | 色噜噜狠狠色综合久| 久久一区二| 免费午夜片| 91精品综合在线观看| 国产真实乱偷精品视频免| 7777久久久国产精品| 国产一区二区在| 亚洲国产另类久久久精品性| 一区二区在线视频免费观看 | 91国内精品白嫩初高生| 欧美一区亚洲一区| 国产精品一区在线播放| 国产精品你懂的在线| 91午夜在线观看| 午夜特片网| 亚洲欧美另类综合| 欧美精品一区二区三区在线四季| 偷拍精品一区二区三区| 国产乱老一区视频| 日韩中文字幕一区二区在线视频 | 日本一区二区免费电影| 亚洲欧洲日韩av| 日韩亚洲欧美一区二区| 天天干狠狠插| 窝窝午夜精品一区二区| 狠狠色狠狠色合久久伊人| 精品videossexfreeohdbbw| 午夜爽爽视频| 国产日韩欧美91| 午夜免费片| 国产v亚洲v日韩v欧美v片| 国产在线不卡一| 国产91丝袜在线熟| 欧美黄色片一区二区| 精品久久综合1区2区3区激情| 欧美日韩国产一区二区三区在线观看 | 国产白丝一区二区三区| 一本色道久久综合亚洲精品图片 | 在线视频不卡一区| 国产精品中文字幕一区二区三区| 久久99国产精品视频| 狠狠操很很干| 狠狠色狠狠色很很综合很久久| 91国偷自产中文字幕婷婷| 免费久久一级欧美特大黄| 久精品国产| 在线亚洲精品| 欧美午夜羞羞羞免费视频app| 精品国产乱码一区二区三区a| 狠狠色噜噜狠狠狠色综合| 搡少妇在线视频中文字幕| 国91精品久久久久9999不卡| 亚洲区日韩| 国产一区在线视频观看| 日韩一区二区精品| 精品日韩久久久| 狠狠色噜噜狠狠狠狠色吗综合| 色噜噜狠狠狠狠色综合久| 国产福利一区在线观看| 大bbw大bbw巨大bbw看看| 久久99精品国产99久久6男男| 午夜伦理片在线观看| 91香蕉一区二区三区在线观看| 国产一区二区三区久久久| 免费看大黄毛片全集免费| 精品久久不卡| 高清欧美xxxx| 国产视频二区| 玖玖国产精品视频| 国产一区二区精品在线| 国产盗摄91精品一区二区三区 | 欧美日韩国产区| 久久久久国产亚洲日本| 国产一区免费在线观看| 欧洲激情一区二区| 国产欧美一区二区三区四区| 99久久精品免费视频| 国产91精品一区二区麻豆亚洲| 欧美精品一区二区三区视频| 国产精欧美一区二区三区久久久| 亚洲乱玛2021| 午夜爽爽视频| 亚洲国产午夜片| 美女销魂免费一区二区| 国产精品96久久久| 国产亚洲精品久久久久久网站 | 国产色婷婷精品综合在线播放| 精品国产一二区| 国产精品一区二区在线观看| 国产麻豆91欧美一区二区| 香蕉免费一区二区三区在线观看| 国产精品国产三级国产aⅴ下载| 欧美日韩一区二区三区在线播放 | 91看黄网站| 亚洲日韩欧美综合| 狠狠综合久久av一区二区老牛| 久久免费福利视频| 一区精品二区国产| 国产精品免费一视频区二区三区 | 亚洲国产精品网站| 狠狠色噜噜狠狠狠狠综合久| 99久久精品一区| 午夜精品影视| 亚洲s码欧洲m码在线观看| 午夜一级电影| 国产一区二区三区黄| 青苹果av| 欧美日韩一区不卡| 在线中文字幕一区| 国产欧美一区二区三区精品观看| 美国三级日本三级久久99| 久久天天躁狠狠躁亚洲综合公司| 国91精品久久久久9999不卡| 人人澡超碰碰97碰碰碰| av午夜影院| 亚洲色欲色欲www| 国产黄一区二区毛片免下载| 欧美日韩三区二区| 国产91一区二区在线观看| 美女直播一区二区三区| 久久免费视频一区二区| 欧美精品亚洲一区| 一区二区三区国产精品| 国产一区二区在线免费| 欧美黑人巨大久久久精品一区| 久久国产精品视频一区| 99爱精品视频| 久久国产免费视频| 国产福利一区在线观看| 精品久久久久久亚洲综合网| 一区二区国产精品| 免费看农村bbwbbw高潮| 午夜wwwww| 黄色91在线观看| 国产大片黄在线观看私人影院|