日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]一種基于深度學(xué)習(xí)和增強(qiáng)學(xué)習(xí)的聚焦爬蟲鏈接價(jià)值預(yù)測(cè)方法有效

專利信息
申請(qǐng)?zhí)枺?/td> 201811442700.0 申請(qǐng)日: 2018-11-29
公開(公告)號(hào): CN109614534B 公開(公告)日: 2021-08-17
發(fā)明(設(shè)計(jì))人: 李石君;黎文丹;楊濟(jì)海;余偉;余放;李宇軒 申請(qǐng)(專利權(quán))人: 武漢大學(xué)
主分類號(hào): G06F16/951 分類號(hào): G06F16/951;G06F16/955;G06N3/06
代理公司: 武漢科皓知識(shí)產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 42222 代理人: 魯力
地址: 430072 湖*** 國(guó)省代碼: 湖北;42
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關(guān)鍵詞: 一種 基于 深度 學(xué)習(xí) 增強(qiáng) 聚焦 爬蟲 鏈接 價(jià)值 預(yù)測(cè) 方法
【權(quán)利要求書】:

1.一種基于深度學(xué)習(xí)和增強(qiáng)學(xué)習(xí)的聚焦爬蟲鏈接價(jià)值預(yù)測(cè)方法,其特征在于,包括:

步驟1,用戶根據(jù)需要配置主題相關(guān)的種子站點(diǎn)URL集合、配置主題相關(guān)關(guān)鍵詞及其對(duì)應(yīng)權(quán)重;在聚焦爬蟲啟動(dòng)時(shí),系統(tǒng)自動(dòng)載入主題相關(guān)URL和主題關(guān)鍵詞;

步驟2,構(gòu)建兩個(gè)具有相同結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò),并初始化各層神經(jīng)元的權(quán)重和偏置;構(gòu)建大小為MEMORY_SIZE的記憶庫,用于存放歷史信息;指定訓(xùn)練集的大小為BATCH_SIZE;

步驟3,給每個(gè)種子站點(diǎn)URL設(shè)置一個(gè)默認(rèn)鏈接價(jià)值,并將種子站點(diǎn)URL放入待爬行隊(duì)列;

步驟4,在待爬行隊(duì)列中按URL鏈接的鏈接價(jià)值大小逆序排列,鏈接價(jià)值包含了對(duì)鏈接目標(biāo)網(wǎng)頁主題相關(guān)度的預(yù)測(cè)和從該鏈接出發(fā)能找到主題相關(guān)頁面的潛力的預(yù)測(cè),選擇鏈接價(jià)值最大的URL鏈接作為爬行目標(biāo);

步驟5,下載器下載爬行目標(biāo)對(duì)應(yīng)的目標(biāo)網(wǎng)頁,從網(wǎng)頁中抽取網(wǎng)頁內(nèi)容相關(guān)信息并計(jì)算網(wǎng)頁主題相關(guān)度;

步驟6,從目標(biāo)網(wǎng)頁中抽取子鏈接URL,將子鏈接的文字信息和結(jié)構(gòu)信息特征化,得到子鏈接特征向量;子鏈接的特征項(xiàng)包括以下八項(xiàng):URL錨文本主題相關(guān)度、URL周圍文字主題相關(guān)度、URL所在頁面主題相關(guān)度、URL所在頁面子鏈接錨文本主題相關(guān)度均值、父URL的鏈接價(jià)值、距離為1的父頁面主題相關(guān)度均值、距離為2的父頁面主題相關(guān)度均值、距離為3的父頁面主題相關(guān)度均值;

步驟7,用增強(qiáng)學(xué)習(xí)方法和兩個(gè)結(jié)構(gòu)相同參數(shù)不同的神經(jīng)網(wǎng)絡(luò)計(jì)算URL的鏈接價(jià)值實(shí)際值和估計(jì)值,并計(jì)算誤差,用梯度下降法優(yōu)化神經(jīng)網(wǎng)絡(luò)參數(shù)并更新兩個(gè)神經(jīng)網(wǎng)絡(luò)的參數(shù);

步驟8,將子鏈接及其相應(yīng)價(jià)值估計(jì)值放入待爬行的優(yōu)先隊(duì)列;

步驟9,重復(fù)步驟4至步驟8直至滿足停止條件;當(dāng)滿足以下任意條件即可停止:

條件一、超過爬行時(shí)間閾值;

條件二、爬行深度超過深度閾值;

條件三、無法獲取新的URL地址。

2.根據(jù)權(quán)利要求1所述的一種基于深度學(xué)習(xí)和增強(qiáng)學(xué)習(xí)的聚焦爬蟲鏈接價(jià)值預(yù)測(cè)方法,其特征在于,步驟2具體操作方法是:構(gòu)建的兩個(gè)三層神經(jīng)網(wǎng)絡(luò)中,神經(jīng)網(wǎng)絡(luò)的第一層為輸入層,神經(jīng)元個(gè)數(shù)與特征向量的維數(shù)一致;神經(jīng)網(wǎng)絡(luò)的第二層為隱藏層,具有至少16個(gè)神經(jīng)元;神經(jīng)網(wǎng)絡(luò)的第三層為輸出層,只有一個(gè)神經(jīng)元,使用relu作為激活函數(shù)。

3.根據(jù)權(quán)利要求1所述的一種基于深度學(xué)習(xí)和增強(qiáng)學(xué)習(xí)的聚焦爬蟲鏈接價(jià)值預(yù)測(cè)方法,其特征在于,步驟5具體包括以下子步驟:

步驟5.1、抽取網(wǎng)頁不同位置的文字信息:能夠概括和表達(dá)網(wǎng)頁內(nèi)容主題的文字信息包括:網(wǎng)頁URL鏈接錨文本、網(wǎng)頁標(biāo)題、網(wǎng)頁描述信息、網(wǎng)頁關(guān)鍵詞信息、網(wǎng)頁正文內(nèi)容;網(wǎng)頁標(biāo)題可以從title標(biāo)簽中抽取,網(wǎng)頁描述信息可以從meta name=”description”標(biāo)簽中抽取,網(wǎng)頁關(guān)鍵詞信息可以從meta name=”keywords”標(biāo)簽中抽取;

步驟5.2、構(gòu)造位置-關(guān)鍵詞詞頻矩陣:

位置-關(guān)鍵詞詞頻矩陣是一個(gè)m*n的矩陣,m為不同位置的個(gè)數(shù),n為主題關(guān)鍵詞個(gè)數(shù);矩陣中每一個(gè)分量tfij表示第i個(gè)位置上第j個(gè)關(guān)鍵詞的詞頻,詞頻的計(jì)算方法為nij表示第i個(gè)位置上第j個(gè)關(guān)鍵詞出現(xiàn)的次數(shù),∑knik表示第i個(gè)位置上所有關(guān)鍵詞出現(xiàn)的總數(shù);

步驟5.3、計(jì)算網(wǎng)頁主題特征向量:

第一個(gè)矩陣是一個(gè)1*m的位置權(quán)值矩陣,代表著不同位置的重要程度,pi表示第i個(gè)位置的權(quán)值;第二個(gè)矩陣是一個(gè)m*n的位置-關(guān)鍵詞詞頻矩陣,代表不同位置不同關(guān)鍵詞出現(xiàn)頻率;

步驟5.4、用余弦相似度計(jì)算主題特征向量和網(wǎng)頁主題特征向量的相似度:

其中,wi表示第i個(gè)關(guān)鍵詞的權(quán)重。

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會(huì)員可以免費(fèi)下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于武漢大學(xué),未經(jīng)武漢大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201811442700.0/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說明:

1、專利原文基于中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實(shí)用新型專利、外觀設(shè)計(jì)專利(升級(jí)中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級(jí)為極速版,下載速度顯著提升!歡迎使用!

請(qǐng)您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊(cè)】

關(guān)于我們 尋求報(bào)道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識(shí) 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢?cè)诰€客服咨詢?cè)诰€客服
tel code back_top
主站蜘蛛池模板: 欧美hdxxxx| 538国产精品一区二区免费视频| 狠狠色噜噜狠狠狠狠69| 色婷婷久久一区二区三区麻豆| 精品国产乱码久久久久久免费| 亚洲区日韩| 91福利视频免费观看| 中文字幕一区二区三区乱码 | 久久久综合亚洲91久久98| 欧美老肥婆性猛交视频| 国产日韩欧美第一页| 欧美乱妇在线视频播放| 精品国产二区三区| 91午夜在线观看| 真实的国产乱xxxx在线91| 国产精品久久久久久久综合| 高清欧美精品xxxxx| 视频二区狠狠色视频| 国产精品免费一视频区二区三区| 激情久久一区二区| 国模一区二区三区白浆| 97精品国产aⅴ7777| 亚洲欧洲一区二区| 国产一区二区在线观| 国产精品v一区二区三区| 狠狠色噜噜狠狠狠狠777| 国产88av| 亚洲欧美一卡| 欧美激情在线免费| 久久夜色精品亚洲噜噜国产mv| 99精品国产一区二区三区不卡| 精品国产一区二区三区忘忧草| 久久99中文字幕| 色午夜影院| 国产中文字幕一区二区三区 | 久久精品综合| av午夜剧场| 国产精品电影一区| 国产精品1234区| 午夜亚洲国产理论片一二三四| 国产精品一二二区| 久久久久久综合网| 国产一二三区免费| 麻豆天堂网| 97国产精品久久| 欧美二区精品| 欧美日韩久久一区二区| 亚洲国产偷| 国产精品伦一区二区三区视频| 久久国产精久久精产国| 国产一区二区极品| 国产91白嫩清纯初高中在线| 久久er精品视频| 97欧美精品| 88888888国产一区二区| 少妇特黄v一区二区三区图片| 欧美一区视频观看| 欧美日韩亚洲国产一区| 日韩午夜电影在线| 国产一区2| 国产精品高潮呻吟视频| 国产理论片午午午伦夜理片2021| 精品久久不卡| 91精品国产麻豆国产自产在线| 精品国产一区二区三| 91精品国产综合久久福利软件| 精品国产一区二| 国产免费一区二区三区四区| 91午夜在线观看| 日韩一区免费在线观看| 国产精品久久91| 久久精品国产99| 99久久国产免费| 日本少妇一区二区三区| 偷拍久久精品视频| 久久99国产综合精品| 欧美髙清性xxxxhdvid| 国产一区二区播放| 国产精品一级片在线观看| 91嫩草入口| 91亚洲欧美日韩精品久久奇米色| 国产精品日韩视频| 国产真实一区二区三区| 天干天干天啪啪夜爽爽99| 欧美极品少妇xx高潮| 国模一区二区三区白浆| 欧美乱妇在线视频播放| 久久九精品| 91精品视频一区二区三区| 精品国产二区三区| 激情久久综合网| 精品国产一级| 国产精品亚州| 亚洲乱在线| 狠狠色噜噜狠狠狠狠色吗综合 | 欧美日韩国产色综合视频| 免费看性生活片| 国产伦精品一区二区三区电影 | 国产日产精品一区二区| 亚洲精品人| 亚洲乱亚洲乱妇50p| 免费看性生活片| 国产精品久久久综合久尹人久久9| 国产一区二区播放| 国产欧美日韩二区| 亚洲欧美日韩视频一区| 午夜码电影| xxxx国产一二三区xxxx| 欧美精品xxxxx| 991本久久精品久久久久| 久久艹亚洲| 麻豆精品久久久| 久久午夜鲁丝片| 精品婷婷伊人一区三区三| 国产精品日韩精品欧美精品| 午夜一级免费电影| 99国产精品免费| 中文字幕一区二区三区四| 国产精品国产三级国产专区53| 久久久久偷看国产亚洲87| 欧美高清xxxxx| 日韩中文字幕亚洲欧美| 一区二区三区四区视频在线| 欧美精品二区三区| 93久久精品日日躁夜夜躁欧美| 7799国产精品久久99| 国产区图片区一区二区三区| 精品视频久| 欧美日韩国产色综合视频| 狠狠色噜噜狠狠狠狠视频| 999亚洲国产精| 午夜免费一级片| 99久久免费精品国产免费高清| 88888888国产一区二区| 欧美精品久久一区| 国产在线精品二区| 久久精品欧美一区二区 | 亚洲欧美国产精品一区二区| 欧美一区二区三区激情在线视频| 国产品久精国精产拍| 男女午夜爽爽| 国产视频1区2区| 性少妇freesexvideos高清bbw| 狠狠色狠狠综合久久| 鲁一鲁一鲁一鲁一鲁一av| 久久久精品a| 国产1区2| 国产精品国产三级国产专区53| 国产日韩欧美在线影视| 国产日韩欧美一区二区在线观看 | 理论片午午伦夜理片在线播放| 久爱精品视频在线播放| 91秒拍国产福利一区| 日韩一区高清| 538国产精品| 亚洲精品丝袜| 午夜av男人的天堂| 久久精品亚洲精品国产欧美| 少妇中文字幕乱码亚洲影视| 亚洲高清国产精品| 国产88av| 国产精品一二二区| 国产精选一区二区| 蜜臀久久精品久久久用户群体| 日韩精品中文字幕一区二区三区 | 国产高清精品一区二区| 欧洲精品一区二区三区久久| 十八无遮挡| 国产精品视频久久久久久久| 久久99精品国产| 香蕉av一区二区三区| 欧美一区二区久久| 999国产精品999久久久久久| 欧美网站一区二区三区| 欧美一区二区三区免费播放视频了 | 午夜社区在线观看| 国产视频一区二区不卡| 秋霞三级伦理| 国产一级自拍| 午夜肉伦伦影院九七影网| 日韩精品中文字幕在线| 91精品视频一区二区| 电影午夜精品一区二区三区| 国产1区2区视频| 久久精品欧美一区二区| 久久久久偷看国产亚洲87| 久爱精品视频在线播放| 亚洲欧美精品suv| 一区二区国产精品| 久久一区二| 国产精品久久久久久久妇女| 国产精品午夜一区二区| 国产精品乱码一区二区三区四川人 | 国产精品99久久久久久宅男| 99精品国产一区二区三区麻豆| 久久激情图片| 色噜噜日韩精品欧美一区二区| 国产视频精品一区二区三区| 亚洲乱亚洲乱妇28p| 久久精品综合视频| 日韩精品中文字幕在线| 国产精品99久久久久久宅男| av午夜影院| 日韩av在线网址| 国产一区二区综合| 精品一区二区三区中文字幕| 欧美一区二区三区片| 91嫩草入口| 国产精品视频免费一区二区| 艳妇荡乳欲伦2| www.久久精品视频| 国产999在线观看| 国产1区2区3区| 性欧美一区二区| 国产精品久久久久久久久久不蜜臀| 日韩av在线网| 91麻豆精品一区二区三区 | 欧美性受xxxx狂喷水| 欧美在线视频一二三区| 久久人人精品| 国产二区视频在线播放| 欧美精品一区二区性色| 精品国产一区二区三区免费| 国产精品天堂| 亚洲欧洲国产伦综合| 理论片午午伦夜理片在线播放| 国产九九九精品视频 | 久久综合久久自在自线精品自| 亚洲欧美另类综合| 91精品国产91热久久久做人人| 久久99视频免费| 国产天堂一区二区三区| 国产福利一区在线观看| 综合久久色| 中文字幕一区二区三区乱码| 亚洲国产一区二区久久久777| 中文字幕一区二区三区不卡| 日本精品99| 日日夜夜亚洲精品| xx性欧美hd| 91久久国产视频| 国模吧一区二区| 亚洲精品456| 日韩亚洲国产精品| 国产一区网址| 国产精品国产三级国产播12软件|