日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]網頁分類方法和裝置、網頁分類器的訓練方法和裝置在審

專利信息
申請號: 201210362603.7 申請日: 2012-09-25
公開(公告)號: CN103678422A 公開(公告)日: 2014-03-26
發明(設計)人: 張中峰;劉書良;趙琴琴;張一凡;羅峰;黃蘇支;李娜 申請(專利權)人: 北京億贊普網絡技術有限公司
主分類號: G06F17/30 分類號: G06F17/30
代理公司: 北京潤澤恒知識產權代理有限公司 11319 代理人: 蘇培華
地址: 100081 北京市海淀*** 國省代碼: 北京;11
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 網頁 分類 方法 裝置 訓練
【權利要求書】:

1.一種網頁分類方法,其特征在于,包括:

提取待分類網頁的用戶搜索行為特征;

依據第一網頁分類器判別該用戶搜索行為特征所屬的網頁類別;其中,所述第一網頁分類器為依據網頁類別樣本的用戶搜索行為特征所構造的分類器。

2.如權利要求1所述的方法,其特征在于,所述提取待分類網頁的用戶搜索行為特征的步驟,進一步包括:

依據所述待分類網頁的頁面地址,在關系數據庫中檢索所述待分類網頁對應的搜索關鍵詞及相應的關系頻率,得到相應的用戶搜索行為特征;

所述關系數據庫中記錄有搜索關鍵詞和搜索跳轉訪問頁面之間的映射關系及相應的關系頻率,所述關系頻率為對用戶搜索行為數據和用戶訪問行為數據進行分析得到,所述搜索跳轉訪問頁面為來源于搜索結果頁面的訪問頁面。

3.如權利要求1所述的方法,其特征在于,所述提取待分類網頁的用戶搜索行為特征的步驟,進一步包括:

依據所述待分類網頁的頁面地址,在用戶訪問行為數據中查詢得到所述待分類網頁對應的用戶物理地址和搜索跳轉信息;

所述用戶訪問行為數據記錄有訪問頁面的頁面地址及對應的用戶物理地址和搜索跳轉信息,所述搜索跳轉信息用于表示當前訪問頁面是否來源于搜索結果頁面,并且,在來源于搜索結果頁面時其包括有搜索結果頁面的頁面地址;

依據所述待分類網頁對應的用戶物理地址和搜索跳轉信息,在所述用戶搜索行為數據中查詢得到所述待分類網頁對應的搜索關鍵詞,作為用戶搜索行為特征;

所述用戶搜索行為數據記錄有搜索關鍵詞及對應的用戶物理地址和搜索結果,其中,所述搜索結果中包括依據搜索關鍵詞得到的多個頁面地址。

4.如權利要求2所述的方法,其特征在于,通過如下步驟對所述用戶搜索行為數據和用戶訪問行為數據進行分析得到所述關系頻率:

通過查詢用戶訪問行為數據,獲取搜索跳轉訪問頁面的頁面地址及對應的用戶物理地址和搜索跳轉信息;

所述用戶訪問行為數據記錄有訪問頁面的頁面地址及對應的用戶物理地址和搜索跳轉信息,所述搜索跳轉信息用于表示當前訪問頁面是否來源于搜索結果頁面,并且,在來源于搜索結果頁面時,其包括有搜索結果頁面的頁面地址;所述搜索跳轉訪問頁面為來源于搜索結果頁面的訪問頁面;

針對搜索跳轉訪問頁面,依據其對應的用戶物理地址和搜索跳轉信息,在用戶搜索行為數據中查詢得到其對應的搜索關鍵詞,并記錄查詢命中的搜索跳轉訪問頁面和搜索關鍵詞的次數;所述用戶搜索行為數據記錄有搜索關鍵詞及對應的用戶物理地址和搜索結果,其中,所述搜索結果中包括依據搜索關鍵詞得到的多個頁面地址;

建立查詢命中的搜索關鍵詞和搜索跳轉訪問頁面之間的映射關系,并將查詢命中的搜索跳轉訪問頁面和搜索關鍵詞的次數作為相應的關系頻率。

5.如權利要求1所述的方法,其特征在于,還包括:

提取待分類網頁的網頁內容特征;

對所述網頁內容特征進行降維;

融合所述用戶搜索行為特征和所述降維后的網頁內容特征,得到融合特征;

依據第二網頁分類器判別該融合特征所屬的網頁類別;其中,所述第二網頁分類器為依據網頁類別樣本的融合特征所構造的分類器。

6.如權利要求5所述的方法,其特征在于,所述用戶搜索行為特征為搜索關鍵詞集合,所述網頁內容特征為內容詞匯集合;

所述融合所述用戶搜索行為特征和所述降維后的網頁內容特征,得到融合特征的步驟,進一步包括:

選取全部所述搜索關鍵詞集合,以及,特定維數的部分所述內容詞匯集合,組成融合特征;所述特定維數為第一預設維數與所述搜索關鍵詞集合維數的差值;或者,

對所述搜索關鍵詞集合和內容詞匯集合的特征值進行歸一化,依據歸一化后的特征值對所述搜索關鍵詞集合和內容詞匯集合進行從高到低的合并排序,并選取排在前面的數目與第二預設維數相應的詞匯,組成融合特征。

7.如權利要求5或6所述的方法,其特征在于,所述網頁內容特征為內容詞匯集合;

所述對所述網頁內容特征進行降維的步驟,進一步包括:

依據分類影響因子,去除所述內容詞匯集合中的噪聲特征;所述分類影響因子具體可以包括規范因子、位置因子、標簽因子、字體因子和詞性因子中的一項或多項。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京億贊普網絡技術有限公司,未經北京億贊普網絡技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201210362603.7/1.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 视频一区二区国产| 日本一二三四区视频| 手机看片国产一区| 亚洲欧美国产中文字幕| 处破大全欧美破苞二十三| 中文字幕制服丝袜一区二区三区| 欧美黄色片一区二区| 伊人av中文av狼人av| 久久激情图片| 国产一区二区视频免费观看| 特高潮videossexhd| 国产欧美一区二区三区沐欲 | 丰满少妇高潮惨叫久久久一| 伊人久久婷婷色综合98网| 欧美精品在线视频观看| 亚洲精品一区,精品二区| 四虎国产精品永久在线国在线| 四虎国产精品永久在线国在线 | 国产精品免费不卡| 羞羞视频网站免费| 久久国产中文字幕| 国产一区二区视频免费在线观看| 91片在线观看| 国产69精品99久久久久久宅男| 人人玩人人添人人澡97| 日韩av一区二区在线播放| 91一区二区三区在线| 亚洲第一天堂无码专区 | 国产区一区| 亚洲神马久久| 国产在线播放一区二区| 曰韩av在线| 国产视频二区| 午夜剧场一级片| 在线视频国产一区二区| 久久九精品| 国产视频一区二区不卡| 国产一区日韩欧美| 窝窝午夜理伦免费影院| 狠狠色丁香久久婷婷综合_中| 中文字幕在线乱码不卡二区区| 亚洲国产偷| 日本xxxx护士高潮hd| 精品久久久久一区二区| 国产精品精品国内自产拍下载| 狠狠色成色综合网| 国产精品久久国产精品99| 国产欧美日韩在线观看| 中文字幕日韩精品在线| 日本99精品| 午夜影院黄色片| 日韩一级片免费观看| 精品久久香蕉国产线看观看gif| 97精品国产97久久久久久粉红| 青苹果av| 欧美日韩中文字幕一区二区三区| 精品久久久久99| 正在播放国产一区二区| 午夜伦理片在线观看| 国产精品偷拍| 福利电影一区二区三区| 欧美乱战大交xxxxx| 欧美大片一区二区三区| 91av一区二区三区| 久久午夜鲁丝片午夜精品| 国产精品偷拍| 亚洲精品久久久久中文字幕欢迎你 | 国产足控福利视频一区| 国产精品视频二区三区| 精品特级毛片| 午夜wwww| 国产精品自产拍在线观看桃花| 国产日韩精品久久| 久久久综合亚洲91久久98| 国产一区二区免费电影| 精品久久久久一区二区| 国产精品v一区二区三区| 久久99精品国产麻豆婷婷| 综合久久一区| 欧美在线观看视频一区二区 | 狠狠插影院| 国产精品免费自拍|