日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]一種融合壓縮DOM樹結構向量的網絡行為預測方法有效

專利信息
申請?zhí)枺?/td> 202011342632.8 申請日: 2020-11-25
公開(公告)號: CN112668309B 公開(公告)日: 2023-03-07
發(fā)明(設計)人: 陳偉寧 申請(專利權)人: 紫光云技術有限公司
主分類號: G06F40/216 分類號: G06F40/216;G06F40/284;G06F40/154;G06F16/35;G06F18/25
代理公司: 天津濱海科緯知識產權代理有限公司 12211 代理人: 劉瑩
地址: 300459 天津市濱海新區(qū)*** 國省代碼: 天津;12
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 融合 壓縮 dom 結構 向量 網絡 行為 預測 方法
【說明書】:

發(fā)明提供了一種融合壓縮DOM樹結構向量的網絡行為預測方法,包括:文本語料篩選,用于增強預測的準確性;詞向量模型,用于增強模型說服力,考慮到每個詞在文本中的重要程度不同,結合TF?IDF原理,計算每個詞的權重,并在引入權重后進行加權平均,最終表示整段文本的特征向量;壓縮DOM樹結構向量生成與向量融合,不同類型網站中的網頁DOM樹在節(jié)點使用和整體結構上都具有一定特點,因此可將DOM樹的結構轉化為向量,并作為輔助條件與文本特征向量融合,構建成最終的融合向量。本發(fā)明所述的一種融合壓縮DOM樹結構向量的網絡行為預測方法,有效篩選重要信息、構建更具說服力的文本特征向量,并采用融合向量的方法提升了準確率。

技術領域

本發(fā)明屬于Web前端技術領域,尤其是涉及一種融合壓縮DOM樹結構向量的網絡行為預測方法。

背景技術

判別用戶的網絡行為類別,實際是對用戶瀏覽網頁類型的分類預測。傳統(tǒng)方法利用日志工具等直接對請求網址類型進行判別,往往準確度不高,且在面對海量數(shù)據(jù)時無法進行全面判斷;

當前主流方法是采用爬蟲策略爬取網頁的全部文本內容,進而構建詞向量模型,再應用機器學習或深度學習方法訓練模型,最后對未知網頁類別進行判斷。這類方法雖然前期工作較為繁瑣,但依靠前期訓練出的優(yōu)良模型,后期工作量不大,且預測準確度得到顯著提升;

當前主流方法存在三個明顯缺點:1、選擇爬取網頁中的全部文本信息,就必然存在大量的噪聲元素,對最終的判別效果產生一定的影響;2、在構建詞向量模型時,采用傳統(tǒng)的均值模型,即用文本中所有詞的詞向量加和取平均后,作為整段文本的特征向量,這種方法在未考慮每個詞重要程度的前提下,為所有詞賦予了相同的權重,這與實際情況是相違背的;3、僅僅選擇文本信息作為數(shù)據(jù)源,使準確度停滯在當前范圍內而無較大提升,這一點也是當前預測精度受限的主要原因。

發(fā)明內容

有鑒于此,本發(fā)明旨在提出一種融合壓縮DOM樹結構向量的網絡行為預測方法,對用戶的網絡行為進行判別,進而有效分析出用戶的網絡行為習慣等信息,為網絡用戶畫像提供可靠的基礎數(shù)據(jù)。

為達到上述目的,本發(fā)明的技術方案是這樣實現(xiàn)的:

一種融合壓縮DOM樹結構向量的網絡行為預測方法,包括:

文本語料篩選,用于增強預測的準確性;

詞向量模型,用于增強模型說服力,考慮到每個詞在文本中的重要程度不同,結合TF-IDF原理,計算每個詞的權重,并在引入權重后進行加權平均,最終表示整段文本的特征向量;

壓縮DOM樹結構向量生成與向量融合,不同類型網站中的網頁DOM樹在節(jié)點使用和整體結構上都具有一定特點,因此可將DOM樹的結構轉化為向量,并作為輔助條件與文本特征向量融合,構建成最終的融合向量。

進一步的,在文本語料篩選中,將以下信息作為網頁中的語料文本:title網頁標題信息標簽1個,keywords網頁關鍵詞標簽1個,description網頁詳細描述標簽1個,a網頁鏈接標簽50個。

進一步的,為了增強模型說服力,考慮到每個詞在文本中的重要程度不同,結合TF-IDF原理,計算每個詞的權重,并在引入權重后進行加權平均,最終表示整段文本的特征向量;

首先按如下公式計算詞頻:

式中nw為特征詞w在文本中出現(xiàn)的次數(shù),N為文本中特征詞總數(shù),則TF用來衡量特征詞在文本中的重要程度;

然后計算逆文本概率:

式中D為文本總數(shù),Q為包含特征詞的文本數(shù),則IDF用于衡量特征詞在所有文本中的重要程度;

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于紫光云技術有限公司,未經紫光云技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202011342632.8/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發(fā)明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業(yè)標識 聯(lián)系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 国产资源一区二区| 久久综合激情网| xxxxhdvideosex| 久久精品国产精品亚洲红杏| 午夜情所理论片| av中文字幕一区二区| 91麻豆精品国产综合久久久久久| 性视频一区二区三区| 中文字幕日韩有码| 色妞妞www精品视频| 久久艹亚洲| 精品无码久久久久国产| 99久久婷婷国产亚洲终合精品| 国产在线观看免费麻豆| 人人玩人人添人人澡97| 国产精品一区在线播放| 国产精品二十区| 九九精品久久| 色婷婷久久一区二区三区麻豆| 久久国产这里只有精品| 国产乱xxxxx97国语对白| 91精品啪在线观看国产手机| 国产日韩欧美精品一区二区| 99精品国产99久久久久久97| 国产91视频一区二区| 九九精品久久| 国产麻豆91欧美一区二区| 欧美日韩一区二区三区四区五区| 日韩av电影手机在线观看| 国偷自产中文字幕亚洲手机在线| 美女张开腿黄网站免费| 91狠狠操| 免费毛片a| 日本三级香港三级网站| av素人在线| 国91精品久久久久9999不卡| 国产精品你懂的在线| 久久免费视频99| 亚洲国产精品一区二区久久,亚洲午夜| 国产乱xxxxx国语对白| xx性欧美hd| 毛片大全免费观看| 午夜剧场a级免费| 亚洲乱玛2021| 日韩欧美一区精品| 狠狠干一区| 日韩有码一区二区三区| 久久久久久中文字幕| 国产91九色视频| 久久精品国产99| 日本边做饭边被躁bd在线看| 国产一级在线免费观看| 国产精品久久久爽爽爽麻豆色哟哟 | 激情久久一区二区三区| 精品国产乱码久久久久久图片| 91久久国产露脸精品| 88国产精品欧美一区二区三区三| 99久久国产综合精品尤物酒店| 91福利试看| 综合久久激情| 欧美日韩一级二级三级| 国产69精品福利视频| 黄色91在线观看| 日本午夜久久| 国产精品国外精品| 91精品第一页| 欧美中文字幕一区二区三区| 日韩av在线一区| 国产一区二区三区小说 | 国产在线拍偷自揄拍视频| 热99re久久免费视精品频软件 | 玖玖精品国产| 日韩精品久久久久久久的张开腿让| 久久噜噜少妇网站| 欧美日韩国产区| 国产二区免费| 欧美日韩一区免费| 日韩欧美一区二区久久婷婷| 国产精品美乳在线观看 | 日本美女视频一区二区| 午夜av男人的天堂| 亚洲欧洲一区二区|