日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]生成數據采集腳本的方法、裝置、計算機設備及存儲介質在審

專利信息
申請號: 202110770812.4 申請日: 2021-07-07
公開(公告)號: CN113687831A 公開(公告)日: 2021-11-23
發明(設計)人: 陳家銀;潘帥;張偉;陳曦;麻志毅 申請(專利權)人: 杭州未名信科科技有限公司;浙江省北大信息技術高等研究院
主分類號: G06F8/41 分類號: G06F8/41;G06F16/906;G06N3/04;G06N3/08
代理公司: 北京辰權知識產權代理有限公司 11619 代理人: 谷波
地址: 311200 浙江省杭州市蕭*** 國省代碼: 浙江;33
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 生成 數據 采集 腳本 方法 裝置 計算機 設備 存儲 介質
【權利要求書】:

1.一種生成數據采集腳本的方法,其特征在于,所述方法包括:

針對目標站點的網頁數據,分別獲取所述網頁數據每個節點包含的文本信息;

根據所述網頁數據中各種標簽的多維度特征生成每個標簽的特征統計信息;

基于所述文本信息和所述特征統計信息,通過訓練好的解析模型對所述網頁數據進行解析,識別待采集數據的路徑,并生成所述目標站點的數據采集腳本。

2.根據權利要求1所述的方法,其特征在于,所述基于所述文本信息和所述特征統計信息,通過訓練好的解析模型對所述網頁數據進行解析,識別待采集數據的路徑,并生成所述目標站點的數據采集腳本,包括:

層級遍歷所述網頁數據的每個節點,并基于每個節點的文本信息依次形成各節點對應的文本表征向量;

依次對所述文本表征向量進行卷積和池化操作,形成新文本表征向量;

基于每個標簽的所述特征統計信息,形成標簽統計向量,并將所述新文本表征向量和所述標簽統計向量進行拼接,得到拼接向量;

將所述拼接向量依次連接全連接層和輸出層,以識別待采集數據的路徑,并生成所述目標站點的數據采集腳本。

3.根據權利要求1所述的方法,其特征在于,所述基于所述文本信息和所述特征統計信息,通過訓練好的解析模型對所述每個節點包含的文本進行解析,并生成數據采集腳本之前,還包括:

基于站點類型相同的多個已解析網頁數據,獲取所述已解析網頁數據的已解析信息和特征統計信息,并通過所述已解析信息和所述特征統計信息訓練并生成所述解析模型;所述已解析信息至少包括Xpath路徑和站點信息。

4.根據權利要求3所述的方法,其特征在于,所述基于站點類型相同的多個已解析網頁數據,獲取所述已解析網頁數據的已解析信息和特征統計信息,并通過所述已解析信息和所述特征統計信息訓練并生成所述解析模型,包括:

層級遍歷該站點類型相同的每個已解析網頁數據的每個節點,獲取所述已解析網頁數據各節點的已解析信息,并基于所有已解析信息形成訓練數據集;

根據站點類型相同的多個已解析網頁數據中各種標簽的多維度特征,生成每個標簽的特征統計訓練向量;

通過所述訓練數據集和所述特征統計訓練向量訓練并生成所述解析模型。

5.根據權利要求4所述的方法,其特征在于,所述基于所有已解析信息形成訓練數據集,包括:

基于所有已解析信息,按照是否包含所需信息對各個節點對應的文本信息進行標注,基于所述標注后的文本信息生成訓練數據集。

6.根據權利要求4所述的方法,其特征在于,所述按照是否包含所需信息對各個節點對應的文本信息進行標注,包括:

對于各個節點,若所述節點的子節點包含所需信息,則對所述子節點的文本信息進行第一標注,對所述節點的文本信息進行第二標注;若所述節點不包含所需信息,則對所述節點的文本信息進行第三標注;且所述第一標注用于使所述解析模型停止遍歷所述網頁數據的節點。

7.根據權利要求1所述的方法,其特征在于,所述多維度特征至少包括標簽數量、標簽密度、文本密度以及權重信息。

8.一種生成數據采集腳本的裝置,其特征在于,所述裝置包括:

文本模塊,用于針對目標站點的網頁數據,分別獲取所述網頁數據每個節點包含的文本信息;

標簽模塊,用于根據所述網頁數據中各種標簽的多維度特征生成每個標簽的特征統計信息;

腳本模塊,用于基于所述文本信息和所述特征統計信息,通過訓練好的解析模型對所述網頁數據進行解析,識別待采集數據的路徑,并生成所述目標站點的數據采集腳本。

9.一種計算機設備,包括存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的計算機程序,其特征在于,所述處理器運行所述計算機程序以實現如權利要求1-7任一項所述的方法。

10.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,所述程序被處理器執行實現如權利要求1-7中任一項所述的方法。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州未名信科科技有限公司;浙江省北大信息技術高等研究院,未經杭州未名信科科技有限公司;浙江省北大信息技術高等研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202110770812.4/1.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖;

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 国产无套精品一区二区| 亚洲少妇一区二区三区| 国产伦精品一区二区三区免费观看| 国产一区二区麻豆| 福利视频亚洲一区| 狠狠插影院| 国产精品自产拍在线观看蜜| 色一情一乱一乱一区免费网站| 91麻豆文化传媒在线观看| 一本色道久久综合亚洲精品图片| 国产一区在线免费观看| 久久国产精品视频一区| 午夜特级片| **毛片在线免费观看| 精品免费久久久久久久苍| 国产三级一区二区| 欧美中文字幕一区二区三区| 精品国产区| 香蕉av一区二区三区| 欧美大片一区二区三区| 国产一区在线视频播放| 亚洲欧洲日韩| 日本美女视频一区二区三区| 国产精品一区二区日韩新区| 国产精品免费一视频区二区三区| 2021天天干夜夜爽| 一色桃子av大全在线播放| 精品在线观看一区二区| 欧美日韩一级在线观看| 欧美一区二区三区视频在线观看| 亚洲精品一区在线| 99久久国产免费,99久久国产免费大片| 欧美亚洲视频一区二区| 国产女人好紧好爽| 中文字幕在线乱码不卡二区区| 国产精品v欧美精品v日韩精品v| 少妇又紧又色又爽又刺激的视频| 鲁丝一区二区三区免费观看| 亚洲欧洲日韩av| 亚洲欧美日韩一级| 欧美黑人巨大久久久精品一区| av午夜在线| 国产精品美女www爽爽爽视频| 亚洲国产欧美一区| 93精品国产乱码久久久| 一色桃子av大全在线播放| 日韩精品一区二区不卡| 国产99久久久久久免费看| 国产精品亚州| 99精品欧美一区二区三区美图| 国产性猛交96| 日本一区二区电影在线观看| 国产精品久久久综合久尹人久久9| 国产在线观看二区| 国产在线不卡一| 午夜诱惑影院| 欧美性受xxxx狂喷水| 国产亚洲另类久久久精品| 一本大道久久a久久精品| 欧美日韩精品在线一区| 亚洲精品老司机| 欧美一区二三区| 综合色婷婷一区二区亚洲欧美国产| 国产欧美一区二区三区精品观看| 亚洲欧美日韩精品suv| 精品国产1区2区| bbbbb女女女女女bbbbb国产| 日韩欧美一区精品| 扒丝袜网www午夜一区二区三区| 亚洲区日韩| 国产一区二区二| 久久夜色精品亚洲噜噜国产mv| 国内久久精品视频| 午夜av男人的天堂| xxxxx色| 李采潭伦理bd播放| 色综合久久久久久久粉嫩| 日韩亚洲国产精品| 亚洲国产欧美一区| 久久国产精品麻豆| 日韩亚洲欧美一区| 国产欧美日韩一区二区三区四区| 日韩av电影手机在线观看| 亚洲欧美另类国产| 国产精品久久久久久久久久不蜜臀| 69久久夜色精品国产7777| 亚洲视频精品一区| 日韩国产精品久久| 欧美乱妇高清无乱码| 日韩av在线电影网| 国产一区二区三区中文字幕| 国产麻豆精品久久| 亚洲国产精品一区在线| 99视频国产精品| 国产在线视频二区| 精品国产九九九| 亚洲精品人| 国产精品久久久爽爽爽麻豆色哟哟 | 国产精品欧美日韩在线| 亚洲精品456| 久久国产精品首页| 精品国产1区2区| 精品婷婷伊人一区三区三| 久久午夜精品福利一区二区| 欧美一级日韩一级| 国产精品电影一区| 午夜av影视| 国产欧美一区二区三区精品观看| 日本美女视频一区二区| 午夜码电影| 国产精品一区二区免费| 日韩av一区二区在线播放| 亚洲乱在线| 色噜噜狠狠色综合久| 男女午夜爽爽| 黄色国产一区二区| 国产综合久久精品| 91精品一二区| 亚洲w码欧洲s码免费| 亚洲精品主播| 精品国产乱码久久久久久影片| 日本久久丰满的少妇三区| 精品久久久久99| 免费a一毛片| 欧美日韩国产91| 日韩无遮挡免费视频| 国产www亚洲а∨天堂| sb少妇高潮二区久久久久| 日韩精品中文字幕一区二区| 久久福利免费视频| 91一区二区在线观看| 午夜免费网址| 久久人人爽爽| 国产又黄又硬又湿又黄| 欧美精品一区二区三区四区在线| 亚洲日本国产精品| 国产全肉乱妇杂乱视频在线观看 | 国产在线观看免费麻豆| 国产大学生呻吟对白精彩在线| 国产69久久| 亚洲乱亚洲乱妇28p| 日本一区二区三区四区高清视频| 午夜精品99| 欧美一级特黄乱妇高清视频| av素人在线| 亚洲欧美另类综合| 国产精品电影免费观看| 99热一区二区| 一区二区三区精品国产| 国产一区二区视频在线| 亚洲精品久久久久中文第一暮| 国产精品久久99| 久久亚洲精品国产日韩高潮| 国产69精品福利视频| 欧美日韩国产一区在线| 一区二区中文字幕在线| 国产一区中文字幕在线观看| 国产一区二区三区四区五区七| 自偷自拍亚洲| 日韩一区免费| 99国产精品丝袜久久久久久| 国产精品久久99| 国产一区午夜| 国产一区不卡视频| 999久久久国产| 丰满岳乱妇bd在线观看k8| 日本午夜精品一区二区三区| 玖玖玖国产精品| 91久久综合亚洲鲁鲁五月天| 国产精品白浆视频| 99热久久这里只精品国产www | 欧美一区视频观看| 麻豆精品一区二区三区在线观看| 91精品丝袜国产高跟在线| 欧美日本三级少妇三级久久| 国产区一区| 精品国产二区三区| 久久婷婷国产香蕉| 国产亚洲精品久久午夜玫瑰园| 国产一区二区极品| 国产精品日韩在线观看| 国内久久久久久| 国产极品美女高潮无套久久久| 精品99在线视频| 欧美日韩乱码| 亚洲美女在线一区| 久久不卡精品| 国产一区不卡视频| 日韩精品乱码久久久久久| 91精品国产高清一二三四区| 狠狠色噜噜狠狠狠狠2018| 国产伦精品一区二区三区电影 | 国产精品久久久久激情影院| 69精品久久| 国产精品人人爽人人做av片| 欧美亚洲视频一区二区| 曰韩av在线| 精品国产一二三四区| 国产精品视频一区二区在线观看 | 99国产精品99久久久久久粉嫩| 日韩三区三区一区区欧69国产| 蜜臀久久久久久999| 欧美在线播放一区| 人人玩人人添人人澡97| 亚洲欧美日韩一级| 国产精品自拍不卡| 91精品国产综合久久国产大片 | 精品国产乱码久久久久久久久| 国产91综合一区在线观看| 国产欧美一区二区精品久久| 国产一区二三| 国产精品日韩一区二区三区| 91麻豆国产自产在线观看hd| 国产日韩欧美不卡| 国产女人和拘做受在线视频| 亚洲精品乱码久久久久久高潮| 国产女人好紧好爽| 97久久超碰国产精品红杏| 乱淫免费视频| 国产精品videossex国产高清| 亚洲国产精品入口| 国产呻吟久久久久久久92| 国产精品久久久久精| 国产欧美日韩二区| 亚洲一二三在线| 99国产伦精品一区二区三区 | 免费**毛片| 国产欧美性| 综合久久色| 久久国产欧美日韩精品| 日韩一区二区福利视频| 一区二区三区国产精华| 国产伦精品一区二区三区电影| 国产免费观看一区| 69xx国产| 日韩午夜一区| 日韩一级片免费视频| 91免费视频国产| 欧美日韩一级二级| 激情欧美日韩| 国产伦精品一区二区三区免费下载 | 久久艹国产精品| 亚洲国产另类久久久精品性| 少妇高潮在线观看| 欧美精品国产精品| 日本伦精品一区二区三区免费|