日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]一種基于時間感知的增量機器爬蟲方法有效

專利信息
申請?zhí)枺?/td> 201810551090.1 申請日: 2018-05-31
公開(公告)號: CN108763537B 公開(公告)日: 2021-05-18
發(fā)明(設計)人: 張志勇;李玉祥;趙長偉;牛丹梅;張麗麗;劉芳云;張藍方;向菲 申請(專利權)人: 河南科技大學
主分類號: G06F16/951 分類號: G06F16/951
代理公司: 洛陽公信知識產權事務所(普通合伙) 41120 代理人: 常曉虎
地址: 471000 河*** 國省代碼: 河南;41
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 基于 時間 感知 增量 機器 爬蟲 方法
【說明書】:

一種基于時間感知的增量機器爬蟲方法,根據(jù)每個頁面的基于初始爬行時間表T={t1,t2,...,tn}的相似性得分序列PTS和最大相似性閾值δ,將大于最大相似性閾值δ的相似性得分和對應的初始時間戳去掉,得到優(yōu)化的相似性得分時間序列new_PTS和優(yōu)化的爬行計劃時間表new_T;如果優(yōu)化的爬行計劃時間表new_T的時間戳數(shù)|new_T|大于最佳爬行頻次,就根據(jù)優(yōu)化的相似性得分序列new_PTS得出降維后的時間感知相似性協(xié)方差矩陣,用MIQP算法得出頁面的最佳爬行時間表,對發(fā)生變化的網(wǎng)頁進行增量更新。本發(fā)明可以為目標頁面制定最優(yōu)的頁面刷新策略,從而降低頁面的刷新代價,減少數(shù)據(jù)冗余的產生,提高爬蟲的效率并保證抓取資源的新鮮性。

技術領域

本發(fā)明屬于互聯(lián)網(wǎng)技術領域,具體涉及一種基于時間感知的增量機器爬蟲方法,主要應用于多媒體社交網(wǎng)絡視頻資源的采集。

背景技術

伴隨著大數(shù)據(jù)和Web2.0技術的興起,多媒體社交網(wǎng)絡(MultimediaSocialNetwork,簡稱MSN)上視頻內容呈現(xiàn)爆炸式增長,豐富的視頻資源為用戶提供了更多更好的視頻服務,同時也為用戶提供了更多有價值的研究數(shù)據(jù)。但是視頻頁面的不斷更新變化使得爬取最新最熱的視頻資源越來越困難,頻繁的刷新頁面不僅會耗費大量的資源,而且會產生大量的冗余。因此,如何在大量的視頻資源中及時了解網(wǎng)頁變化的特征,用最低的刷新代價爬取最新的視頻資源,給用戶提供更加優(yōu)質的服務,成為當前多媒體社交網(wǎng)絡服務的一個挑戰(zhàn)。

一般情況下,網(wǎng)頁是否發(fā)生變化是通過不同時間上頁面之間的相似度來檢測的。相似度越小,說明網(wǎng)頁的差異度越大,網(wǎng)頁發(fā)生了變化。通過這種方式,我們可以監(jiān)控不同時間網(wǎng)頁的變化情況,找出網(wǎng)頁變化最大的幾個時間點。在這些時間點上對變化的網(wǎng)頁進行頁面刷新。

增量爬蟲技術就是使用某種頁面刷新策略來確保頁面副本的新穎性。其中,針對頁面變化的研究是制定頁面刷新策略的重點。無論是通過采樣樣本的方式來確定刷新時刻,還是使用基于泊松(Poisson)分布的頁面刷新策略,或者是基于信息周期的刷新策略,都存在數(shù)據(jù)冗余、刷新代價大、新鮮度得不到有效保證等問題。

發(fā)明內容

本發(fā)明的目的是針對頻繁重爬技術效率低,刷新代價大,數(shù)據(jù)冗余等問題,提供一種基于時間感知的增量機器爬蟲方法,通過分析頁面更新模式特征,結合信息精確度和信息新鮮度的指標,為發(fā)生有價值變化的網(wǎng)頁制定最優(yōu)的頁面刷新策略。

為了實現(xiàn)上述目的,本發(fā)明采用的具體方案為:一般情況下,網(wǎng)頁是否發(fā)生變化是通過不同時間上頁面之間的相似度來檢測的。相似度越小,說明網(wǎng)頁的差異度越大,網(wǎng)頁發(fā)生了變化。通過這種方式,我們可以監(jiān)控不同時間網(wǎng)頁的變化情況,找出網(wǎng)頁變化最大的幾個時間點。在這些時間點上對變化的網(wǎng)頁進行頁面刷新。因此本發(fā)明在K.Gupta教授的精度感知頁面刷新策略的基礎上增加新鮮度感知和降維思想來確定網(wǎng)頁刷新的最優(yōu)爬行時間序列,提出基于時間感知的增量爬蟲算法,進一步提高增量爬蟲的效率和獲取信息的新鮮度。

一種基于時間感知的增量機器爬蟲方法,包括如下步驟:

第一步,根據(jù)每個頁面的基于初始爬行時間表T={t1,t2,...,tn}的相似性得分序列PTS和最大相似性閾值,去掉相似性得分序列PTS中大于最大相似性閾值的相似性得分,以組成優(yōu)化的相似性得分序列new_PTS,并將所去掉的相似性得分對應的時間戳從初始爬行時間表中去掉,以得到優(yōu)化的爬行計劃時間表new_T;

第二步,如果優(yōu)化的爬行計劃時間表new_T的時間戳數(shù)|new_T|大于最佳爬行頻次,就根據(jù)優(yōu)化的相似性得分序列new_PTS得出降維后的時間感知相似性協(xié)方差矩陣;

第三步,用MIQP算法優(yōu)化第二步中降維后的時間感知相似性協(xié)方差矩陣,得出頁面的最佳爬行時間表,也意味著頁面在最佳爬行時間表中的時間戳上將會發(fā)生有價值的變化;

第四步,根據(jù)第三步得到的頁面的最佳爬行時間表,對發(fā)生變化的網(wǎng)頁進行增量更新。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于河南科技大學,未經河南科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201810551090.1/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發(fā)明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標識 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 片毛片免费看| 日韩精品一区二区三区免费观看| 国产黄色一区二区三区| 国产午夜精品一区二区三区四区| 欧美日韩一区免费| 中文在线√天堂| 夜夜爽av福利精品导航| 午夜看大片| 国产精品久久99| 国产中文字幕91| 亚洲精品人| 久久综合国产伦精品免费| 国产91在| 青苹果av| 中出乱码av亚洲精品久久天堂| 国产精品一二三在线观看| 亚洲女人av久久天堂| 国产精品19乱码一区二区三区| 亚洲国产精品入口| 亚洲欧美自拍一区| 日韩精品免费播放| 国产日韩欧美亚洲| 欧美hdfree性xxxx| 精品一区二区三区自拍图片区| 亚洲乱码av一区二区三区中文在线:| 久久99久久99精品蜜柚传媒| 狠狠躁夜夜躁| 亚洲国产精品97久久无色| 狠狠色噜噜狠狠狠四色米奇| 国产日韩一二三区| 国产精品久久免费视频| 亚洲一区欧美| 91精品久久久久久久久久| 欧美日韩精品影院| 日韩中文字幕在线一区| 午夜精品一区二区三区在线播放| 91理论片午午伦夜理片久久| 欧美亚洲另类小说| 亚洲精品一区中文字幕| 国产麻豆精品一区二区| 国产精品网站一区| 一色桃子av| 日韩欧美高清一区| 456亚洲精品| 国产精品视频久久| 一区二区欧美精品| 亚洲久久在线| 日韩不卡毛片| 亚洲伊人久久影院| 国产精品伦一区二区三区在线观看| 一级久久精品| 国产一区二区三区乱码| 久久99精品久久久久国产越南| 国产欧美一区二区三区免费| 国产一a在一片一级在一片| 激情久久综合| 日日夜夜亚洲精品| 欧美中文字幕一区二区三区| 亚欧精品在线观看| 91波多野结衣| 日本一区二区三区电影免费观看| 欧美精品国产一区二区| 久久久久亚洲| 国产福利精品一区| 国产又黄又硬又湿又黄 | 日日夜夜精品免费看| 日韩一级免费视频| 91理论片午午伦夜理片久久| 99精品国产一区二区三区不卡| 国产亚洲精品久久久久久久久动漫| 夜色av网站| 日韩欧美一区精品| 久久久久国产精品免费免费搜索| 久久一区欧美| 国产网站一区二区| 精品国产一二三四区| 久久精品二| 91精品国产高清一区二区三区| 麻豆精品国产入口| 91看片免费| 欧美一区二三区| 亚洲欧美一卡| 国产精品久久久av久久久| 强制中出し~大桥未久10在线播放| 国产亚洲精品久久yy50| 狠狠色综合久久丁香婷婷| a级片一区| 国产精品久久久麻豆| 亚洲欧美日韩精品在线观看| 国产一区在线视频播放| 国产乱人乱精一区二视频国产精品| 欧美色综合天天久久| 99久久免费精品国产男女性高好| 538国产精品| 日本激情视频一区二区三区| 99精品欧美一区二区三区美图| 欧美国产三区| 2020国产精品自拍| 国产一a在一片一级在一片 | 久久久久国产精品www| 一区二区在线不卡| 亚洲精品国产主播一区| 对白刺激国产对白精品城中村| 久久乐国产精品| 岛国精品一区二区| 91精品婷婷国产综合久久竹菊 | 久久第一区| 国产一区日韩精品| 国产一区二区91| 精品国产区| 午夜亚洲影院| 国产欧美一区二区三区免费看 | 欧美日韩综合一区二区| 国产一二区精品| 视频一区二区国产| 亚洲乱在线| 欧美精品一区二区性色| 免费看性生活片| 久久精品综合| 久久精品国语| 激情久久综合| 日本三级香港三级| 亚洲午夜久久久久久久久电影院| 国产高清精品一区二区| 久久免费视频99| 国产vsv精品一区二区62| 亚洲欧美日韩一级| 国产精品一区二区久久乐夜夜嗨| 91久久香蕉| 99久久国产综合精品女不卡| 在线播放国产一区| 日韩亚洲欧美一区| 欧美一区二区三区日本| 午夜电影网一区| 国产足控福利视频一区| 91精品国产一区二区三区| 国产精品久久久麻豆| 国产精品美乳在线观看 | 亚洲精品日韩在线| 国产无套精品久久久久久| 久久一二区| 国内少妇自拍视频一区| 狠狠色噜噜狠狠狠狠2021天天| 日本99精品| 欧美在线观看视频一区二区| 国产精品v一区二区三区| 日韩精品一区二区亚洲| 少妇久久免费视频| 欧美日韩国产91| 99国精视频一区一区一三| 国产.高清,露脸,对白| 午夜av男人的天堂| 国产精品一二三区视频出来一 | 97国产精品久久| 久久久久国产亚洲日本| 国产精品18久久久久白浆| 国产白丝一区二区三区| 国产精品久久久久久久久久久久久久久久久久 | 久久精品99国产精品亚洲最刺激| 欧美午夜精品一区二区三区| 亚洲欧洲一区二区| 久久久久国产精品一区二区三区| 国产一区在线精品| 欧美一区二区三区免费视频| 亚洲欧美日韩国产综合精品二区 | 在线观看欧美一区二区三区| 销魂美女一区二区| 国产欧美精品va在线观看| 国产精品禁18久久久久久| 国产美女三级无套内谢| 精品久久二区| 午夜影院伦理片| 亚洲乱亚洲乱妇50p| 亚洲国产一区二| 欧美精品国产精品| 国产99视频精品免费视频7| 久久精品国产亚洲7777| 电影午夜精品一区二区三区| 亚洲精品久久久久www| 国产一区二区片| 日本午夜精品一区二区三区| 久久精品综合| 91精品夜夜| 国产福利一区在线观看| 欧美一区二区三区久久| 亚洲国产精品91| 国产在线干| 91精品资源| 色综合久久精品| 国产69精品久久久久999天美| 妖精视频一区二区三区| 日韩av在线播放观看| 国产在线欧美在线| 国产精品1区二区| 岛国黄色网址| 欧美高清xxxxx| 国产淫片免费看| 91波多野结衣| 亚洲少妇一区二区三区| 少妇高潮在线观看| 91精彩刺激对白露脸偷拍| 亚洲精品国产主播一区| 强制中出し~大桥未久在线播放| 久久二区视频| 国v精品久久久网| 国产乱子一区二区| 岛国黄色av| 91久久国产露脸精品| 狠狠色噜噜狠狠狠狠69| 欧美在线一级va免费观看| 国产人成看黄久久久久久久久| 欧美一区二区综合| 国内少妇偷人精品视频免费| 欧美激情在线观看一区| 国产超碰人人模人人爽人人添| 亚洲乱亚洲乱妇50p| 国产99久久九九精品| 91精品国产影片一区二区三区| 国产乱码精品一区二区三区介绍| 影音先锋久久久| 欧美hdfree性xxxx| 国产精品黑色丝袜的老师| 午夜一区二区三区在线观看| 国产日韩一区二区在线| 国产精品美女www爽爽爽视频| 美女直播一区二区三区| 综合久久一区| 7777久久久国产精品| 国产午夜亚洲精品| 日韩亚洲国产精品| 国产91热爆ts人妖系列| 91精品资源| 国产aⅴ一区二区| 午夜三级大片| 国产精品日韩视频| 在线观看v国产乱人精品一区二区| 国产在线一卡| 亚洲一级中文字幕| 欧美日韩国产在线一区二区三区| 免费看农村bbwbbw高潮| 国产aⅴ一区二区| 日本伦精品一区二区三区免费| 国偷自产一区二区三区在线观看| 久久99中文字幕| 色综合久久精品| 26uuu亚洲国产精品|