日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]用于對網(wǎng)頁數(shù)據(jù)進(jìn)行分類的分類模型的訓(xùn)練方法及裝置在審

專利信息
申請?zhí)枺?/td> 201910548164.0 申請日: 2019-06-24
公開(公告)號: CN112131445A 公開(公告)日: 2020-12-25
發(fā)明(設(shè)計)人: 胡單;陳偉 申請(專利權(quán))人: 第四范式(北京)技術(shù)有限公司
主分類號: G06F16/906 分類號: G06F16/906;G06K9/62
代理公司: 北京鼎佳達(dá)知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11348 代理人: 劉鐵生;孟阿妮
地址: 100085 北京市海淀區(qū)上*** 國省代碼: 北京;11
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關(guān)鍵詞: 用于 網(wǎng)頁 數(shù)據(jù) 進(jìn)行 分類 模型 訓(xùn)練 方法 裝置
【說明書】:

發(fā)明公開了一種對網(wǎng)頁數(shù)據(jù)進(jìn)行分類的分類模型的訓(xùn)練方法及裝置,包括:從網(wǎng)頁中對應(yīng)不同路徑的網(wǎng)頁數(shù)據(jù)中獲取訓(xùn)練樣本數(shù)據(jù),所述訓(xùn)練樣本數(shù)據(jù)包括網(wǎng)頁數(shù)據(jù)的網(wǎng)頁內(nèi)容和路徑信息;獲取關(guān)于所述訓(xùn)練樣本數(shù)據(jù)的真實分類結(jié)果的分類標(biāo)簽;至少基于網(wǎng)頁內(nèi)容和路徑信息來生成所述訓(xùn)練樣本數(shù)據(jù)的特征;基于由所述訓(xùn)練樣本數(shù)據(jù)的特征以及訓(xùn)練樣本數(shù)據(jù)的分類標(biāo)簽組成的訓(xùn)練樣本,通過預(yù)設(shè)機器學(xué)習(xí)算法,訓(xùn)練用于對網(wǎng)頁數(shù)據(jù)進(jìn)行分類的分類模型。本發(fā)明用于在網(wǎng)頁數(shù)據(jù)進(jìn)行分類時的分類模型的訓(xùn)練過程。

技術(shù)領(lǐng)域

本發(fā)明涉及網(wǎng)絡(luò)技術(shù)領(lǐng)域,尤其涉及一種用于對網(wǎng)頁數(shù)據(jù)進(jìn)行分類的分類模型的訓(xùn)練方法及裝置。

背景技術(shù)

隨著大數(shù)據(jù)時代的到來,網(wǎng)絡(luò)中的數(shù)據(jù)量已大大增加。為了進(jìn)行數(shù)據(jù)的分析和研究,對網(wǎng)頁中數(shù)據(jù)進(jìn)行分類已變得越發(fā)重要。一般情況下,在獲取數(shù)據(jù)時需要確定需獲取數(shù)據(jù)的位置,例如,確定網(wǎng)頁中每一條數(shù)據(jù)的路徑信息作為獲取網(wǎng)頁數(shù)據(jù)的依據(jù)。例如,基于機器學(xué)習(xí)的興起,結(jié)合機器學(xué)習(xí)的網(wǎng)頁數(shù)據(jù)挖掘方法也逐步廣泛。在基于機器學(xué)習(xí)的網(wǎng)頁數(shù)據(jù)挖掘過程中,一般需要對樣本數(shù)據(jù)的位置進(jìn)行標(biāo)注從而訓(xùn)練對應(yīng)的模型,其中該標(biāo)注方式是通過對該樣本數(shù)據(jù)的位置添加用以表征其位置的數(shù)組進(jìn)行的。例如,樣本數(shù)據(jù)A的標(biāo)注方式是為其添加[1,2,6,3,1,2,1,3,2,2,1]數(shù)組。其中,數(shù)組中第一位的1表示為整個頁面代碼中最外面的第一層標(biāo)簽,即為html;第二位的2表示在上一層的html標(biāo)簽下的第二個標(biāo)簽body;第三位的6表示在上一層body標(biāo)簽下的第6個標(biāo)簽,即為div,以此類推。

然而,在實際應(yīng)用中,這種基于位置數(shù)組為數(shù)據(jù)進(jìn)行標(biāo)注的方式,會導(dǎo)致分類模型訓(xùn)練的過程中存在較大難度,譬如當(dāng)網(wǎng)頁的數(shù)據(jù)內(nèi)容較多、數(shù)據(jù)的位置層級較多、位置結(jié)構(gòu)較為復(fù)雜時,其位置數(shù)組內(nèi)的內(nèi)容也大幅度增加,從而導(dǎo)致維度擴展極大,這樣就導(dǎo)致模型的訓(xùn)練過程中增加了機器學(xué)習(xí)的難度,整體上增加了網(wǎng)頁數(shù)據(jù)分類過程中的難度。另外,基于其訓(xùn)練過程中僅包含位置特征,這就使所訓(xùn)練的模型在網(wǎng)頁結(jié)構(gòu)變化較大時,模型判斷的準(zhǔn)確性降低,從而使得基于該模型的網(wǎng)頁數(shù)據(jù)的分類結(jié)果的準(zhǔn)確性也隨之降低。由此,如何實現(xiàn)一種能夠簡化訓(xùn)練過程并提高模型的準(zhǔn)確性的網(wǎng)頁數(shù)據(jù)分類方法,已成為領(lǐng)域中亟待解決的問題。

發(fā)明內(nèi)容

鑒于上述問題,本發(fā)明提出了一種用于對網(wǎng)頁數(shù)據(jù)進(jìn)行分類的分類模型的訓(xùn)練方法及裝置,主要目的在于在對網(wǎng)頁數(shù)據(jù)分類時簡化分類模型的訓(xùn)練過程的同時提高模型的準(zhǔn)確性。

為達(dá)到上述目的,本發(fā)明主要提供如下技術(shù)方案:

第一方面,本發(fā)明提供用于對網(wǎng)頁數(shù)據(jù)進(jìn)行分類的分類模型的訓(xùn)練方法,具體包括:

從網(wǎng)頁中對應(yīng)不同路徑的網(wǎng)頁數(shù)據(jù)中獲取訓(xùn)練樣本數(shù)據(jù),所述訓(xùn)練樣本數(shù)據(jù)包括網(wǎng)頁數(shù)據(jù)的網(wǎng)頁內(nèi)容和路徑信息;

獲取關(guān)于所述訓(xùn)練樣本數(shù)據(jù)的真實分類結(jié)果的分類標(biāo)簽;

至少基于網(wǎng)頁內(nèi)容和路徑信息來生成所述訓(xùn)練樣本數(shù)據(jù)的特征;以及

基于由所述訓(xùn)練樣本數(shù)據(jù)的特征以及訓(xùn)練樣本數(shù)據(jù)的分類標(biāo)簽組成的訓(xùn)練樣本,通過預(yù)設(shè)機器學(xué)習(xí)算法,訓(xùn)練用于對網(wǎng)頁數(shù)據(jù)進(jìn)行分類的分類模型。

可選的,所述至少基于網(wǎng)頁內(nèi)容和路徑信息來生成所述訓(xùn)練樣本數(shù)據(jù)的特征,包括:基于網(wǎng)頁內(nèi)容生成訓(xùn)練樣本數(shù)據(jù)的內(nèi)容特征,并基于路徑信息生成訓(xùn)練樣本的結(jié)構(gòu)特征。

可選的,所述至少基于網(wǎng)頁內(nèi)容和路徑信息來生成所述訓(xùn)練樣本數(shù)據(jù)的特征,還包括:

基于所述訓(xùn)練樣本數(shù)據(jù)的路徑信息與預(yù)設(shè)標(biāo)準(zhǔn)路徑之間的差異來生成訓(xùn)練樣本的路徑相似度特征,所述預(yù)設(shè)標(biāo)準(zhǔn)路徑對應(yīng)所述網(wǎng)頁數(shù)據(jù)所屬網(wǎng)站中特定網(wǎng)頁數(shù)據(jù)的路徑;

可選的,所述從網(wǎng)頁中對應(yīng)不同路徑的網(wǎng)頁數(shù)據(jù)中獲取訓(xùn)練樣本數(shù)據(jù)包括:

在各個網(wǎng)頁中,分別通過遍歷全部路徑的網(wǎng)頁數(shù)據(jù)來分別獲取對應(yīng)網(wǎng)頁數(shù)據(jù)的網(wǎng)頁內(nèi)容和路徑信息,作為所述訓(xùn)練樣本數(shù)據(jù)。

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會員可以免費下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于第四范式(北京)技術(shù)有限公司,未經(jīng)第四范式(北京)技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201910548164.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說明:

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實用新型專利、外觀設(shè)計專利(升級中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進(jìn)行下載,點擊【登陸】 【注冊】

關(guān)于我們 尋求報道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: xoxoxo亚洲国产精品| 久久一区二区精品| 久久精品国产一区二区三区| 久久久久久久国产| 好吊妞国产欧美日韩免费观看网站 | 色婷婷精品久久二区二区蜜臂av| 欧美午夜精品一区二区三区| 亚洲精品456| 91精品视频免费在线观看| 国产日韩欧美三级| 私人影院av| 91精品啪在线观看国产线免费| 亚洲欧美国产一区二区三区| 亚洲欧美一卡| 午夜免费片| 久久夜靖品2区| 久草精品一区| 一区二区国产精品| 国产在线一区观看| 国产精品天堂网| 久久伊人色综合| 国产二区精品视频| 午夜看大片| 欧美一区二区三区片| 狠狠色噜噜狠狠狠狠| 91久久国产露脸精品国产| 国产区图片区一区二区三区| 韩日av一区二区| 91精品第一页| 国产清纯白嫩初高生在线观看性色| 日本美女视频一区二区三区| 欧美xxxxxhd| 日本高清一二三区| 午夜一二区| 欧美乱大交xxxxx古装| 99久久精品国| 久久久久久亚洲精品| 国产三级精品在线观看| 国产午夜三级一二三区| 日本午夜一区二区| 亚洲福利视频一区| 亚洲乱玛2021| 黄色国产一区二区| 国产一区二区激情| 91久久精品久久国产性色也91| 欧美亚洲视频二区| 日韩av一二三四区| 在线国产91| 精品国产一二区| 久久三级精品| 国产精品视频久久| 91久久香蕉国产日韩欧美9色| 国产一a在一片一级在一片| 欧美乱码精品一区二区| 日韩欧美一区精品| 91精品国产综合久久国产大片| 毛片免费看看| 欧美日韩国产在线一区二区三区 | 亚洲少妇一区二区三区| 午夜爽爽爽男女免费观看 | 91久久精品在线| 久久久久久中文字幕| 欧美精品八区| 午夜情所理论片| 久久99亚洲精品久久99| 亚洲第一区国产精品| 国产精品高清一区| 91理论片午午伦夜理片久久| 亚洲精品丝袜| 日本三级香港三级网站| 91久久国产露脸精品国产| 国产一区二区三区影院| 午夜三级大片| 欧美三级午夜理伦三级中视频| 99久精品视频| 国产精品视频久久久久久久 | 久久99精| 国产免费第一区| 4399午夜理伦免费播放大全| 日韩欧美激情| 99精品国产一区二区三区不卡| 亚洲国产aⅴ精品一区二区16| 久久国产精品久久| 一区精品二区国产| 久久亚洲综合国产精品99麻豆的功能介绍| 99久久婷婷国产综合精品草原| 午夜av电影院| 国产精品一区亚洲二区日本三区 | 91热精品| 日本一区二区三区在线视频| 97人人澡人人爽91综合色| 欧美一区二区三区激情在线视频| 一区二区三区国产精品视频| 91波多野结衣| 美女直播一区二区三区| 爽妇色啪网| 在线精品国产一区二区三区| 国产精品视频久久久久久久| 国产精品96久久久| 中文无码热在线视频| 农村妇女毛片精品久久| 性色av色香蕉一区二区三区| 狠狠色综合久久婷婷色天使| 日本一区午夜艳熟免费| 久久国产麻豆| 日韩中文字幕亚洲精品欧美| 日韩偷拍精品| 99久久婷婷国产综合精品草原| 中文字幕久久精品一区| 久久99国产精品视频| 一级久久久| 久久国产精久久精产国| 欧美日韩一区不卡| 日韩欧美国产第一页| 99色精品视频| 国产午夜精品免费一区二区三区视频| 免费的午夜毛片| 国产精品视频免费看人鲁| 狠狠插影院| 狠狠色噜噜狠狠狠狠视频| 久久久久国产精品www| 国产欧美久久一区二区三区| 久久久久国产精品嫩草影院| 久久一区二区三区欧美| 99久久久久久国产精品| 99日韩精品视频| 在线精品视频一区| 少妇厨房与子伦在线观看| 午夜亚洲影院| 精品久久小视频| 国产88久久久国产精品免费二区| 久久九九亚洲| 最新国产一区二区| 国产精品自拍不卡| 中文字幕一区一区三区| 日韩av在线播放观看| 精品国产一区二区三区忘忧草| 狠狠色噜噜狼狼狼色综合久| 国产特级淫片免费看| 精品香蕉一区二区三区| 十八无遮挡| 精品国产鲁一鲁一区二区作者 | 亚洲欧美自拍一区| 中文字幕二区在线观看| 中文字幕久久精品一区| 精品国产一二区| 欧美精品在线一区二区| 91亚洲精品国偷拍| 精品久久久影院| 国产免费一区二区三区网站免费| 午夜生活理论片| 精品国产乱码一区二区三区a | 欧美性二区| 欧美日韩一二三四区| 国产特级淫片免费看| 欧美日韩国产123| 欧美日韩精品在线一区| 国产69精品久久久久孕妇不能看| 亚洲欧美国产一区二区三区| 欧美日韩国产免费观看| 国产一级一区二区| 高清在线一区二区| 亚洲精品久久久久久久久久久久久久 | 日韩精品中文字幕在线| 亚洲女人av久久天堂| 美国一级片免费观看| 国产日本一区二区三区| 午夜av免费观看| 99精品少妇| 精品国产免费久久| 亚洲国产精品一区在线| 精品国产一区二区三区高潮视| 欧美日韩一区电影| 黑人巨大精品欧美黑寡妇| 国产一区二区激情| 色一情一交一乱一区二区三区| xxxx在线视频| 国产精品视频免费看人鲁| 国产精自产拍久久久久久蜜| 国产日韩欧美三级| 国产伦精品一区二区三区无广告| 欧美乱码精品一区二区| 偷拍久久精品视频| 少妇高潮在线观看| 国产理论一区二区三区| 91人人爽人人爽人人精88v| 国产欧美一区二区三区沐欲| 欧美日韩精品不卡一区二区三区 | 91黄色免费看| 玖玖爱国产精品| 欧美精品第1页| 国产一区二区日韩| 中文字幕1区2区3区| 国产69精品久久99不卡解锁版| 国产乱人乱精一区二视频国产精品| 国产男女乱淫视频高清免费| 国产真实乱偷精品视频免| 欧美精品一区久久| 久久久久久久亚洲视频| 精品香蕉一区二区三区| 欧美日韩综合一区二区| 99久久精品国产国产毛片小说 | 精品福利一区| 亚洲高清毛片一区二区| 国产男女乱淫真高清视频免费| 精品免费久久久久久久苍| 亚洲精品主播| 欧美在线免费观看一区| 午夜激情在线| 国产欧美日韩另类| 国产精品免费一视频区二区三区| 色综合久久精品| 91福利视频免费观看| 午夜社区在线观看| 国产精品禁18久久久久久| 欧洲激情一区二区| 91精品一区在线观看| 久久精品亚洲一区二区三区画质| 日本一区二区三区免费视频| 日本一二三区视频在线| 国产精选一区二区| 91性高湖久久久久久久久_久久99| 久精品国产| 福利片91| 精品久久香蕉国产线看观看gif| 国产床戏无遮挡免费观看网站 | 欧美一区二区三区免费播放视频了| 国产一区二区国产| 92久久精品| 中文字幕一级二级三级| 亚洲欧洲日韩av| 51区亚洲精品一区二区三区| 午夜伦全在线观看| 国产精品99久久久久久宅男| 国产精品日产欧美久久久久| 狠狠插影院| 日韩av在线一区| 欧美日韩国产精品一区二区三区| 国产精品视频久久久久久久| 精品欧美一区二区在线观看| 免费看欧美中韩毛片影院| 国产精品第157页| 国产精品女同一区二区免费站| 国产精品一区二区三区在线看| 日韩一级精品视频在线观看| 亚洲精品国产主播一区|