日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]確定網(wǎng)站更新信息的方法、裝置、設備和存儲介質(zhì)在審

專利信息
申請?zhí)枺?/td> 202011625737.4 申請日: 2020-12-30
公開(公告)號: CN112650910A 公開(公告)日: 2021-04-13
發(fā)明(設計)人: 徐軍;楊光;許海洋;王藝 申請(專利權)人: 北京百度網(wǎng)訊科技有限公司
主分類號: G06F16/951 分類號: G06F16/951;G06F16/958;G06F16/903;G06F16/906;G06N3/04
代理公司: 中科專利商標代理有限責任公司 11021 代理人: 范芳茗
地址: 100085 北京市*** 國省代碼: 北京;11
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 確定 網(wǎng)站 更新 信息 方法 裝置 設備 存儲 介質(zhì)
【權利要求書】:

1.一種確定網(wǎng)站更新信息的方法,包括:

抓取目標網(wǎng)站的多個網(wǎng)頁,所述多個網(wǎng)頁包括列表頁和內(nèi)容頁;

從抓取的多個網(wǎng)頁中識別列表頁以及與所識別的列表頁關聯(lián)的內(nèi)容頁;

針對每個識別的列表頁,確定與所識別的列表頁關聯(lián)的內(nèi)容頁的地址的正則表達式;以及

根據(jù)所述正則表達式來確定與所識別的列表頁關聯(lián)的內(nèi)容頁的更新。

2.根據(jù)權利要求1所述的方法,其中,從抓取的多個網(wǎng)頁中識別列表頁以及與所識別的列表頁關聯(lián)的內(nèi)容頁包括:

針對所述多個網(wǎng)頁的網(wǎng)頁標題進行特征提取,獲得第一特征向量;

針對所述多個網(wǎng)頁的除標題以外的網(wǎng)頁其他文本進行特征提取,獲得第二特征向量;

針對所述多個網(wǎng)頁的網(wǎng)頁地址進行特征提取,獲得第三特征向量;以及

利用神經(jīng)網(wǎng)絡模型對所述第一特征向量、所述第二特征向量和所述第三特征向量進行分類處理,從所述多個網(wǎng)頁中識別列表頁以及與所識別的列表頁關聯(lián)的內(nèi)容頁。

3.根據(jù)權利要求2所述的方法,其中,針對所述多個網(wǎng)頁的網(wǎng)頁標題進行特征提取,獲得第一特征向量包括:

利用詞典提取所述網(wǎng)頁標題的特征;以及

基于Embedding詞向量轉(zhuǎn)換將提取的特征轉(zhuǎn)換為所述第一特征向量。

4.根據(jù)權利要求2所述的方法,其中,針對所述多個網(wǎng)頁的除標題以外的網(wǎng)頁其他文本進行特征提取,獲得第二特征向量包括:

以枚舉的方式提取除標題以外的網(wǎng)頁其他文本的特征,并對提取的特征出現(xiàn)的次數(shù)進行統(tǒng)計;以及

基于提取的特征和統(tǒng)計的次數(shù)形成所述第二特征向量。

5.根據(jù)權利要求2所述的方法,其中,針對所述多個網(wǎng)頁的網(wǎng)頁地址進行特征提取,獲得第三特征向量包括:

提取所述網(wǎng)頁地址中的關鍵字符串;以及

基于One-Hot詞向量轉(zhuǎn)換將所述關鍵字符串轉(zhuǎn)換為所述第三特征向量。

6.根據(jù)權利要求2至5中任一項所述的方法,其中,所述神經(jīng)網(wǎng)絡模型包括第一子模型、第二子模型、第三子模型和第四子模型,所述利用神經(jīng)網(wǎng)絡模型對所述第一特征向量、所述第二特征向量和所述第三特征向量進行分類處理包括:

分別使用所述第一子模型、所述第二子模型和所述第三子模型對所述第一特征向量、所述第二特征向量和所述第三特征向量的維度進行調(diào)整,以使所述第一特征向量、所述第二特征向量和所述第三特征向量的維度相同;

將經(jīng)調(diào)整的所述第一特征向量、所述第二特征向量和所述第三特征向量合并為輸入向量矩陣;以及

使用第四子模型對所述輸入向量矩陣進行分類處理。

7.根據(jù)權利要求6所述的方法,其中,所述第一子模型包括雙向長短記憶網(wǎng)絡,所述第二子模型包括全連接神經(jīng)網(wǎng)絡,所述第三子模型包括卷積神經(jīng)網(wǎng)絡,所述第四子模型包括全連接神經(jīng)網(wǎng)絡。

8.根據(jù)權利要求1所述的方法,其中,確定與所識別的列表頁關聯(lián)的內(nèi)容頁的地址的正則表達式包括:

獲取與所識別的列表頁關聯(lián)的內(nèi)容頁的地址的第一集合;

通過對所述第一集合中所包括的地址進行聚合,確定所述第一集合中所包括的地址的字符串的公共部分;以及

基于所確定的公共部分來確定所述正則表達式。

9.根據(jù)權利要求1所述的方法,其中,根據(jù)所述正則表達式來確定與所識別的列表頁關聯(lián)的內(nèi)容頁的更新包括:

基于所述正則表達式,通過爬蟲服務周期地爬取所識別的列表頁來得到與所識別的列表頁關聯(lián)的內(nèi)容頁的地址的第二集合;以及

通過將當前周期爬取得到的第二集合與前一周期爬取得到的第二集合相比較,來確定所述第二集合中新增的內(nèi)容頁。

10.根據(jù)權利要求1所述的方法,其中,抓取目標網(wǎng)站的多個網(wǎng)頁包括:

抓取目標網(wǎng)站的在預設的鏈接層級以內(nèi)的網(wǎng)頁或抓取預設數(shù)量的網(wǎng)頁。

下載完整專利技術內(nèi)容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網(wǎng)訊科技有限公司,未經(jīng)北京百度網(wǎng)訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202011625737.4/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產(chǎn)權局專利說明書;

2、支持發(fā)明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標識 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 麻豆精品一区二区三区在线观看| 亚洲国产精品一区在线| www.午夜av| 久久久精品久久日韩一区综合| 日韩精品一区二区三区免费观看| 93久久精品日日躁夜夜躁欧美| 国产精品1区二区| 久久综合国产精品| 亚洲欧洲日韩在线| 国产无遮挡又黄又爽又色视频| 一区二区三区欧美精品| 亚洲精品久久久久久动漫| 欧美日韩三区| 欧美午夜一区二区三区精美视频| 国产999久久久| 午夜看片网| 久久精品视频中文字幕| 国产91免费在线| 午夜无遮挡| 羞羞免费视频网站| 日本大码bbw肉感高潮| 日韩精品久久一区二区| 色综合久久88| 国产精品对白刺激在线观看| 精品国产伦一区二区三区免费 | 特级免费黄色片| 国产精品麻豆99久久久久久| 午夜一级电影| 久草精品一区| 午夜老司机电影| 午夜激情在线播放| 色综合久久网| 免费毛片a| 99视频国产精品| 国产99视频精品免视看芒果| 女人被爽到高潮呻吟免费看| 国产麻豆一区二区| 久久国产欧美一区二区三区精品| 91视频国产九色| 国产视频一区二区不卡| 狠狠躁夜夜躁2020| 艳妇荡乳欲伦2| 国产精品美女久久久另类人妖| 热re99久久精品国99热蜜月| 91黄色免费看| 亚洲精品久久久中文| 国产99久久久久久免费看| 国产一级片网站| 欧美日韩一区二区三区在线观看视频| 色婷婷精品久久二区二区蜜臂av| 久久福利免费视频| 日本黄页在线观看| 国产在线一区观看| **毛片在线免费观看| 日韩欧美一区精品| 国产精品亚洲一区二区三区| 国产69精品久久久久app下载 | 久久99精品久久久大学生| 国产精品久久久久久久久久久新郎 | 国产精品久久久久四虎| 国产免费第一区| 日韩av在线中文| 亚洲影院久久| 午夜伦全在线观看| 99久久夜色精品| 精品一区二区三区影院| 亚洲日本国产精品| 国产91丝袜在线| 国产一区二区三区久久久| 日韩欧美高清一区二区| 国产精品理人伦一区二区三区| 欧美一区二区三区在线视频播放| 亚洲精品主播| 欧美综合国产精品久久丁香| 国产精品久久久久久久久久久久久久不卡| 强行挺进女警紧窄湿润| 农村妇女毛片精品久久| 亚洲欧美另类久久久精品2019| 欧美一区二区三区久久精品| 欧美在线观看视频一区二区| 天干天干天干夜夜爽av| 欧美国产一二三区| 中文字幕欧美一区二区三区| 国产一区二区在线91| 午夜影院黄色片| 躁躁躁日日躁网站| 午夜影院色| 色综合欧美亚洲国产| 精品久久国产视频| xxxx18hd护士hd护士| 91免费看国产| 91精品啪在线观看国产手机 | 亚洲午夜精品一区二区三区电影院| 国产v亚洲v日韩v欧美v片| 精品欧美一区二区在线观看| 亚洲福利视频一区二区| 欧美一级久久久| 美日韩一区| 国产在线播放一区二区| 欧美国产精品久久| 99re热精品视频国产免费| 国产精品美乳在线观看 | 夜夜夜夜曰天天天天拍国产| 女人被爽到高潮呻吟免费看| 中文字幕日本精品一区二区三区| 处破大全欧美破苞二十三| 欧美日韩国产午夜| 国产精品美乳在线观看| 国产一区二区视频免费在线观看| 日本一码二码三码视频| 国产精品欧美久久久久一区二区| 国产玖玖爱精品视频| 欧美日本一二三区| 国产精品亚州| 欧美黑人巨大久久久精品一区| 国产91热爆ts人妖系列| 69久久夜色精品国产69–| 狠狠色狠狠色综合久久一| 国产亚洲久久| 曰韩av在线| 91热精品| 欧美日韩一区电影| 国产天堂第一区| 日韩国产精品久久| 日韩区欧美久久久无人区| 久久久久久国产一区二区三区| 亚洲日韩aⅴ在线视频| 欧美3p激情一区二区三区猛视频| 国产精品久久久不卡| 6080日韩午夜伦伦午夜伦| 午夜wwww| 国产1区2区视频| 午夜国产一区二区三区四区| 国产第一区二区三区| 日韩精品一区二区三区四区在线观看| 欧美国产三区| 欧美午夜看片在线观看字幕| 欧美在线播放一区| 久久夜色精品亚洲噜噜国产mv| av国产精品毛片一区二区小说| 国产一级片子| 理论片午午伦夜理片在线播放| 国产欧美亚洲一区二区| 夜色av网| 日本高清一二区| 欧美日韩精品在线一区| 欧美三区二区一区| 久久久午夜爽爽一区二区三区三州| 国产一级二级在线| 久久精品中文字幕一区| 精品国产一区二| 亚洲1区在线观看| 亚洲欧美精品suv| 日韩久久精品一区二区三区| 日韩精品一区二区免费| 亚洲欧美日韩精品suv| 国产白丝一区二区三区| 国产电影精品一区| 神马久久av| 亚洲神马久久| 午夜电影网一区| 欧美日韩一区二区三区在线观看视频| 国产精品视频免费看人鲁| 国产午夜一区二区三区| 高清欧美精品xxxxx在线看| 久久99国产视频| 国产欧美日韩综合精品一| 国产91精品一区二区麻豆亚洲| 男人的天堂一区二区| 国内精品久久久久久久星辰影视| 日韩欧美一区精品| 91国偷自产中文字幕婷婷| 国产一区二区伦理| 国产精品乱码一区| 91久久精品国产91久久性色tv| 91精品国产高清一区二区三区| 国产日韩欧美亚洲| 亚洲一二区在线观看| 香蕉av一区二区| 991本久久精品久久久久| 日韩国产精品久久| 国产色婷婷精品综合在线播放 | 国产精品一区久久人人爽| 日本午夜精品一区二区三区| 销魂美女一区二区| 中文字幕天天躁日日躁狠狠躁免费 | 国产欧美日韩二区| 日韩一区免费| 日本一区二区在线观看视频| 国产美女三级无套内谢| 欧美精品xxxxx| 欧美日韩国产在线一区二区三区 | 狠狠插影院| 香港日本韩国三级少妇在线观看| 久久国产精彩视频| 大bbw大bbw巨大bbw看看 | 国产91麻豆视频| 国产一区在线免费观看| 国产精品欧美一区乱破| 激情久久精品| 亚洲精品老司机| 日本午夜影视| 日韩av免费电影| 亚洲免费精品一区二区| 久久久久久久国产| 国产天堂第一区| 国产黄色网址大全| 国产一级在线免费观看| 日韩精品一区二区三区四区在线观看| 国内精品国产三级国产99| 久久青草欧美一区二区三区| 亚洲国产精品97久久无色| 少妇高潮在线观看| 久久综合激情网| 91精品系列| 亚洲自拍偷拍一区二区三区| 91久久香蕉国产日韩欧美9色| 久久久精品欧美一区二区| 国产在线一区观看| 99久久婷婷国产精品综合| 51区亚洲精品一区二区三区| 国产一区二区免费在线| 国产伦理久久精品久久久久| 大bbw大bbw巨大bbw看看| 真实的国产乱xxxx在线91| 国产伦精品一区二区三区免费下载| 97人人模人人爽人人喊0| 国产精品视频免费一区二区| 97精品国产97久久久久久免费| 午夜特片网| 91精品综合| 一区二区精品久久| 精品国产一区在线| 欧美精品第1页| 欧美一区二区综合| 免费超级乱淫视频播放| 一本色道久久综合亚洲精品图片| 精品国产九九九| 午夜性电影| 91午夜在线观看| 爽妇色啪网| 国产精品一区二区三区在线看| 香港日本韩国三级少妇在线观看 | 久久国产欧美一区二区三区精品| 国产欧美三区| 久久精品国产亚洲一区二区|