日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種文檔版本集合的計算方法有效

專利信息
申請號: 202010986308.3 申請日: 2020-09-18
公開(公告)號: CN112149008B 公開(公告)日: 2022-09-23
發明(設計)人: 曾祥宇;王君 申請(專利權)人: 四川工商學院
主分類號: G06F16/9537 分類號: G06F16/9537;G06F16/955;G06F16/182
代理公司: 成都弘毅天承知識產權代理有限公司 51230 代理人: 丁存偉
地址: 620000 四川*** 國省代碼: 四川;51
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 文檔 版本 集合 計算方法
【說明書】:

發明公開了一種文檔版本集合的計算方法,屬于計算機和大數據應用交叉領域;本發明包括如下步驟:指定URL下載快照,以時間戳為文件名Fn,快照內容為文件內容Content存儲;清除html標簽和時光機的特殊標簽,并將修改后的內容保存;計算Content的MD5值,并修改Content為MD5值、制表符和Fn;上傳所有文檔到Hadoop集群的HDFS文件系統;Map階段,將Content拆分,使得key為MD5值,value為Fn,并發送key?value;Reduce階段,累加相同key的計數,將value的值Fn連接到container;對于同一個key,組織輸出內容為key、count和container。

技術領域

一種文檔版本集合的計算方法,是基于互聯網時光機(wayback machine)抓取數據的文檔版本管理方法,屬于計算機和大數據應用交叉領域。

背景技術

公布在互聯網的某URL(Uniform Resource Locator,統一資源定位符)是說明文檔,通常是該產品的最新版本;一般地,用戶可以從時光機查看到某URL所存儲的所有說明書文檔,以時間點進行存儲,即時光機爬蟲抓取的時間。

如果在過去十年內,該產品更新了許多版本,只要用戶使用的不是該產品的最新版本,則無法在公布的說明文檔URL上得到使用文檔,通過時光機也無法準確得到某個版本的產品文檔。

MD5信息摘要算法(MD5 Message-Digest Algorithm)是一種密碼散列函數,可以產生出一個128位的散列值,用于確保信息傳輸完整一致;將一個文件的所有二進制內容進行MD5計算,就得到文件的MD5值,其特點是,即使只有一個字節被修改,修改前后文件的MD5值也會發生變化;許多語言庫函數支持MD5計算,比如PHP語言調用函數MD5(文件名)可以計算得到文件的MD5值。

Hadoop是一個由Apache基金會開發的可運行于大規模計算機集群上的分布式并行編程開源框架,原來是全文檢索引擎Lucene的子項目,設計之初是為了處理Lucene抓取的海量索引,包括存儲和計算,后來獨立成為一個分布式基礎構架;它主要包括文件系統HDFS和計算模型MapReduce等模塊,MapReduce可以讓開發者不用關心分布式計算框架的實現細節,而主要編寫自己的處理邏輯;MapReduce程序的核心步驟分兩部分:Map和Reduce,Map收到一個計算作業時,首先把計算作業拆分成若干個Map任務,分配到不同的節點上去執行,每一個Map任務處理輸入數據的一部分,一般以“鍵-值對”(key-value)方式存儲Map任務處理結果,當Map任務完成后會生成一些中間文件,這些中間文件作為Reduce任務的輸入數據,Reduce對數據的“鍵-值對”做進一步組合處理后輸出最終結果;HDFS是分布式文件存儲與管理系統,一般建立在操作系統的本地文件系統基礎之上,供集群網絡的節點使用,在HDFS上,大文件會被分隔成多個數據塊分布存儲,其高效訪問模式是一次寫入、多次讀取。

HTML(Hyper Text Markup Language)稱為超文本標記語言,是一種標識性的語言,它包括一系列標簽,通過這些標簽可以將網絡上的文檔格式統一,使分散的Internet資源連接為一個邏輯整體;HTML通常由瀏覽器讀取,按照其標簽的要求向用戶展示內容,標簽由小于號開始,大于號結束,由瀏覽器負責解釋,一般并不會展示在用戶內容上。

本發明主要清洗HTML標簽,以及所有“script”和“/script”之間的腳本代碼,因為此間代碼一般不用于閱讀,只用于邏輯判定,若代碼帶時間戳則會影響MD5值的計算,所以刪除,這樣得到接近瀏覽器展示的文檔內容,然后計算文檔內容的MD5值,最后計算相同MD5值的元素,組成文檔的版本集合。

發明內容

本發明的目的在于:提供一種文檔版本集合的計算方法,通過文擋集合對比,簡化了查新、查重的工作。

本發明采用的技術方案如下:一種文檔版本集合的計算方法,包括如下步驟:

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于四川工商學院,未經四川工商學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202010986308.3/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 国产97在线看| 国产精品亚洲精品一区二区三区| 一区二区三区免费高清视频| 亚洲国产精品日韩av不卡在线| 亚洲精品久久久久999中文字幕| 国产一区二区中文字幕| 国产人伦精品一区二区三区| 制服.丝袜.亚洲.另类.中文| 欧美精品xxxxx| 午夜伦理片在线观看| 91亚洲欧美日韩精品久久奇米色 | 久久艹亚洲| free性欧美hd另类丰满| 性old老妇做受| 国产精品久久久久久久新郎| 久久婷婷国产香蕉| 国产区二区| 欧美一区二区三区激情视频| 国产农村妇女精品一二区| 国产99网站| 日韩精品久久一区二区三区| 亚洲三区二区一区| 国产一区二区播放| 国产乱老一区视频| 国产极品美女高潮无套久久久| 久久99中文字幕| 久久99精品久久久久国产越南| 日韩中文字幕在线一区| 99欧美精品| 色婷婷久久一区二区三区麻豆| 国产精品久久久久久久龚玥菲| 国产大片黄在线观看私人影院| 亚洲乱强伦| 亚洲国产一区二| 国产精品一区二区三| 日本道欧美一区二区aaaa| 日韩一级在线视频| 中文文精品字幕一区二区| 欧美一区二粉嫩精品国产一线天| 91avpro| 91精品黄色| 91夜夜夜| 欧美网站一区二区三区| 免费精品一区二区三区第35| 久久一区欧美| 午夜欧美a级理论片915影院 | 国产精品人人爽人人做av片| 国产一区二区视频免费在线观看| 久久久综合亚洲91久久98| 亚洲少妇中文字幕| 99国产午夜精品一区二区天美| 91久久精品国产亚洲a∨麻豆 | 国产精品一区二区日韩新区 | 欧美精品免费视频| 亚洲精品国产一区| 国产一区二区中文字幕| 国产精品18久久久久白浆| 99精品少妇| 国产一区午夜| 国产1区2| 精品一区二区三区自拍图片区| 欧美激情片一区二区| 国产69精品福利视频| 国产亚洲精品久久久456| 九色国产精品入口| 少妇高清精品毛片在线视频| 国产精品一区二区免费| 91国偷自产中文字幕婷婷| 欧美一区二区性放荡片| 亚洲精品乱码久久久久久按摩| 一区二区三区电影在线观看| 久久夜色精品亚洲噜噜国产mv| 色婷婷综合久久久中文一区二区| 国产亚洲精品久久久久动| 欧美3级在线| 久久精品—区二区三区| 欧美一区二三区人人喊爽| 欧美高清xxxxx| 91人人爽人人爽人人精88v| 久久两性视频| 欧美精品一区免费| 国产乱xxxxx97国语对白| 国产日韩欧美亚洲综合| 日韩av在线影院| 国产乱了高清露脸对白| 国产高清一区在线观看| 国产精品白浆一区二区| 国产高清在线观看一区| 欧美一区二区三区免费在线观看| 奇米色欧美一区二区三区| 日韩精品一区在线观看| 午夜剧场a级免费| 狠狠综合久久av一区二区老牛| 久久精品一| 激情久久精品| 欧美在线观看视频一区二区| 国产精品一区二区在线观看免费| 国产馆一区二区| 欧美日韩国产色综合视频| 狠狠色综合欧美激情| 欧美一区二区久久| 久久国产精品广西柳州门| 91久久一区二区| 国产精品丝袜综合区另类| 欧美激情在线一区二区三区| 国产清纯白嫩初高生视频在线观看| 国产一二区在线| 岛国黄色网址| 免费看片一区二区三区| 国产精品视频一区二区三| 国产伦精品一区二区三区免费观看| 国产精品九九九九九九| 国产精品v亚洲精品v日韩精品| 99国产午夜精品一区二区天美| xxxx18hd护士hd护士| 国产精品伦一区二区三区级视频频 | 在线国产一区二区三区| 性国产videofree极品| free×性护士vidos欧美| 7777久久久国产精品| 猛男大粗猛爽h男人味| 欧美高清极品videossex| 性欧美一区二区| 亚洲精品一区中文字幕| 国产伦精品一区二区三区四区| 欧美髙清性xxxxhdvid| 国产黄色网址大全| 国产第一区二区三区| 国产精品美女www爽爽爽视频| 亚洲精品乱码久久久久久蜜糖图片| 精品无码久久久久国产| 扒丝袜网www午夜一区二区三区 | 久久99亚洲精品久久99果| 亚洲精品乱码久久久久久蜜糖图片| 狠狠躁日日躁狂躁夜夜躁av| 国产视频一区二区视频| 国产免费第一区| 日韩av在线网址| 国产精品久久久久久av免费看| 国产欧美亚洲精品第一区软件| 国产一区二区91| 亚洲午夜国产一区99re久久| 日韩av不卡一区| 亚洲精品一品区二品区三品区| 亚洲欧美日韩一级| 91麻豆精品国产91久久久久推荐资源| 狠狠色噜狠狠狠狠| 99re6国产露脸精品视频网站| 日本久久不卡| 日日噜噜夜夜狠狠| 久久九九亚洲| 国产福利精品一区| 免费a一毛片| 亚洲一级中文字幕| 欧美二区在线视频| 欧美激情午夜| 一区二区在线不卡| 99精品久久久久久久婷婷| 性欧美一区二区| 亚洲国产一二区| 91精品视频免费在线观看| 99国产精品久久久久| 亚洲欧美另类久久久精品2019| 国产一卡在线| 国产一区免费在线观看| 日本白嫩的18sex少妇hd| 国产麻豆91视频| 91亚洲欧美日韩精品久久奇米色| 欧美精品在线观看视频| 精品久久久久久中文字幕| 国产免费一区二区三区四区五区| 午夜在线看片| 精品久久久综合| 日韩欧美中文字幕精品| 国产精品一区二区毛茸茸| 欧美一区二区三区艳史| 88888888国产一区二区| 亚洲五码在线| 日韩精品一区二区免费| 一区二区三区国产精品| 久久久久国产精品免费免费搜索| 狠狠色噜噜狠狠狠狠视频| 国产一区二区精华| 久久第一区| 欧美一区二区三区高清视频| 国产精品偷伦一区二区| 日本高清h色视频在线观看| 日韩女女同一区二区三区| 精品国产一二区| 欧美老肥婆性猛交视频| 国产男女乱淫真高清视频免费| 久久99视频免费| 欧美精品久久一区| 午夜精品在线播放| 国产伦精品一区二区三区电影| 欧美日韩卡一卡二| 国产不卡三区| 国产欧美一区二区三区四区| 69xx国产| 欧美老肥婆性猛交视频| 欧美一区二区三区四区夜夜大片| 911久久香蕉国产线看观看| 国产69精品久久久久999天美| 91av精品| 69久久夜色精品国产69–| 欧美资源一区| 精品国产一区二区三| 国产综合亚洲精品| 国产精品久久久久久一区二区三区| 国产伦高清一区二区三区| 久久密av| 91九色精品| 国产清纯白嫩初高生视频在线观看| 国产精品乱码一区二区三区四川人| 久久免费福利视频| 久久国产精久久精产国| 日韩av不卡一区| 国产97久久| 高清欧美精品xxxxx| 午夜毛片在线| 狠狠躁夜夜躁2020| 亚洲精品久久久久久动漫| 野花国产精品入口| 欧美精品在线视频观看| 国产品久久久久久噜噜噜狼狼 | 色一情一乱一乱一区99av白浆| 99三级视频| 麻豆精品国产入口| 国产精品69av| 国产精品视频免费看人鲁| 国产精品高潮在线| 午夜大片网| 午夜看片网站| 国产三级国产精品国产专区50| 爱看av在线入口| 国产一级一片免费播放| 国产一级在线免费观看| 亚洲一二三在线| 神马久久av| 亚洲网久久| 91亚洲精品国偷拍自产| 亚洲天堂国产精品| 99久久国产综合精品色伊| 国产一区精品在线观看| 亚洲w码欧洲s码免费| 国产精品久久久久久久久久久新郎|