日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]數(shù)據(jù)處理方法、推薦源信息組織和信息推薦方法及裝置在審

專利信息
申請?zhí)枺?/td> 201410080600.3 申請日: 2014-03-06
公開(公告)號: CN104899215A 公開(公告)日: 2015-09-09
發(fā)明(設計)人: 郭奇;肖鏡輝;商勝;崔華 申請(專利權)人: 北京搜狗科技發(fā)展有限公司
主分類號: G06F17/30 分類號: G06F17/30;G06Q30/02
代理公司: 北京華沛德權律師事務所 11302 代理人: 劉杰
地址: 100084 北京市海淀區(qū)中關*** 國省代碼: 北京;11
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 數(shù)據(jù)處理 方法 推薦 信息 組織 裝置
【權利要求書】:

1.一種數(shù)據(jù)處理方法,其特征在于,包括:

對收集到的多個用戶進行網(wǎng)絡訪問的行為記錄數(shù)據(jù)進行過濾,以從所述收集到的行為記錄數(shù)據(jù)中獲取帶類別的樣本數(shù)據(jù);

針對所述帶類別的樣本數(shù)據(jù),對各類別的樣本數(shù)據(jù)分別進行特征詞抽取;

存儲所述抽取的特征詞與相應的類別之間的對應關系。

2.如權利要求1所述的方法,其特征在于,所述對收集到的多個用戶進行網(wǎng)絡訪問的行為記錄數(shù)據(jù)進行過濾包括:

根據(jù)各行為記錄數(shù)據(jù)中的統(tǒng)一資源定位符URL是否符合模板來對所述多個用戶的行為記錄數(shù)據(jù)進行過濾,并獲得帶類別的樣本數(shù)據(jù);

其中,所述行為記錄數(shù)據(jù)中的URL包括:用戶訪問的當前頁面的URL;

或者所述行為記錄數(shù)據(jù)中的URL包括:用戶訪問的當前頁面的URL和用戶訪問的當前頁面的前一頁面的URL。

3.如權利要求2所述的方法,其特征在于,所述根據(jù)各行為記錄數(shù)據(jù)中的統(tǒng)一資源定位符URL是否符合模板來對所述多個用戶的行為記錄數(shù)據(jù)進行過濾包括:

利用帶類別的最終頁URL模板分別判斷每個行為記錄數(shù)據(jù)中的用戶訪問的當前頁面的URL是否有所屬的類別;和/或

利用帶類別的前一頁URL模板分別判斷每個行為記錄數(shù)據(jù)中的用戶訪問的當前頁面的前一頁面的URL是否有所屬的類別,利用通用的最終頁URL模板分別判斷每個行為記錄數(shù)據(jù)中的用戶訪問的沒有所屬的類別的當前頁面的URL是否屬于通用的最終頁,且在沒有所屬的類別的當前頁的URL屬于通用的最終頁的情況下,將用戶訪問的當前頁面的前一頁面的URL所屬的類別確定為用戶訪問的當前頁的URL所屬的類別。

4.如權利要求3所述的方法,其特征在于,所述對收集到的多個用戶進行網(wǎng)絡訪問的行為記錄數(shù)據(jù)進行過濾還包括:

從各行為記錄數(shù)據(jù)中分別獲取具有所屬類別的當前頁面的URL所對應的標題,并對所述標題進行前后綴過濾;和/或者,

在各行為記錄數(shù)據(jù)中的用戶訪問的當前頁面的前一頁面的URL具有所屬類別、用戶訪問的當前頁面的URL沒有所屬類別且屬于通用的最終頁的情況下,從行為記錄數(shù)據(jù)中獲取當前頁面的前一頁面的URL所對應的鏈接標題,對所述鏈接標題進行前后綴過濾;

且所述對收集到的多個用戶進行網(wǎng)絡訪問的行為記錄數(shù)據(jù)進行過濾還包括:將所述過濾后的各標題和/或者所述過濾后的各鏈接標題中的重復內容去重,獲得所述帶類別的樣本數(shù)據(jù)。

5.如權利要求1所述的方法,其特征在于,所述對各類別的樣本數(shù)據(jù)分別進行特征詞抽取包括:

針對每一個類別中的所有樣本數(shù)據(jù),分別進行分詞處理,以獲得每一個類別的詞集合;

根據(jù)每一個類別的詞集合中的每個詞的屬性確定詞集合中的特征詞。

6.如權利要求5所述的方法,其特征在于,所述詞的屬性包括:

詞在所屬類別中的詞頻逆向文件頻率、詞在所屬類別中出現(xiàn)的次數(shù)、詞在所屬類別中出現(xiàn)的次數(shù)與詞在樣本數(shù)據(jù)中出現(xiàn)的總的次數(shù)的比例、詞在所屬類別中作為獨立搜索詞及非獨立搜索詞的比例以及詞作為獨立搜索詞與從用戶群體角度講的輸入頻率的比例中的至少一個。

7.如權利要求6所述的方法,其特征在于,其中,所述根據(jù)每一個類別的詞集合中的每個詞的屬性確定詞集合中的特征詞包括:

當詞在所屬類別中的詞頻逆向文件頻率大于第一預置閾值,或者,

詞在所屬類別中出現(xiàn)的次數(shù)大于第二預置閾值且詞在所屬類別中出現(xiàn)的次數(shù)與詞在樣本數(shù)據(jù)中出現(xiàn)的總的次數(shù)的比例大于第三預置閾值,

則確定該詞為所屬類別的特征詞;

或者

所述根據(jù)每一個類別的詞集合中的每個詞的屬性確定詞集合中的特征詞在包括:

當詞在所屬類別中的詞頻逆向文件頻率大于第一預置閾值,或者,

詞在所屬類別中出現(xiàn)的次數(shù)大于第二預置閾值且詞在所屬類別中出現(xiàn)的次數(shù)與詞在樣本數(shù)據(jù)中出現(xiàn)的總的次數(shù)的比例大于第三預置閾值,的情況下,

還包括:

詞在所屬類別中作為獨立搜索詞及非獨立搜索詞的比例大于第四預置閾值和/或詞作為獨立搜索詞與從用戶群體角度講的輸入頻率的比例大于第五預置閾值的情況下,則確定該詞為所屬類別的特征詞。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京搜狗科技發(fā)展有限公司,未經(jīng)北京搜狗科技發(fā)展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201410080600.3/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產(chǎn)權局專利說明書;

2、支持發(fā)明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標識 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 国产精品日韩一区二区三区| 久久久久久综合网| 午夜影院啊啊啊| 2018亚洲巨乳在线观看| 欧美乱妇在线视频播放| 91精品国产91久久久| 一区不卡av| 日本一区二区三区四区高清视频| 欧美精品免费一区二区| 日日夜夜亚洲精品| 久久精品国产精品亚洲红杏| 国产精品女同一区二区免费站| 99视频国产在线| av午夜在线观看| 国产欧美日韩在线观看 | 99精品小视频| 欧美一区二区激情三区| 强行挺进女警紧窄湿润| 狠狠色噜噜狠狠狠狠黑人| 久久99中文字幕| 色婷婷久久一区二区三区麻豆| 午夜三级电影院| 97涩国一产精品久久久久久久| 国产一区二区在| 国产精品18久久久久久白浆动漫| 999亚洲国产精| 色综合久久久| 国产韩国精品一区二区三区| 亚洲制服丝袜在线| 国产69精品久久久久app下载| 少妇特黄v一区二区三区图片| 亚洲欧美一二三| 欧美日韩激情在线| 91精品一区| 一区二区三区欧美在线| 国产亚洲精品久久久久秋霞| 亚洲第一天堂久久| 国产乱人伦精品一区二区三区| 国产精品你懂的在线| 黄色91在线观看| 91久久国语露脸精品国产高跟| 久久99精品国产麻豆婷婷| 国产剧情在线观看一区二区| 久久精品—区二区三区| 精品福利一区| **毛片免费| 国产精品久久二区| 一区二区三区中文字幕| 亚洲午夜久久久久久久久电影院| 午夜情所理论片| 免费久久一级欧美特大黄| 丰满岳乱妇在线观看中字| 亚欧精品在线观看| 欧美日韩偷拍一区| 91福利视频导航| 91精品国模一区二区三区| 乱淫免费视频| 欧美一区二区精品久久911| 狠狠插狠狠插| 国产精品久久久久久av免费看| 国产精品视频二区三区| 国产欧美一区二区在线观看| 亚洲欧美一二三| 一区二区久久精品| 国产三级欧美三级日产三级99| 亚洲无人区码一码二码三码| 中文字幕一区三区| 欧美中文字幕一区二区三区| 国产91免费在线| 特高潮videossexhd| 亚洲精品主播| 日韩一区免费| 欧美日韩精品在线一区二区| 国产午夜精品一区二区三区在线观看| 久久免费精品国产| 亚洲精品久久在线| 99久久精品免费看国产交换| 97精品国产97久久久久久| 亚洲午夜精品一区二区三区| 一级黄色片免费网站| av午夜影院| 午夜国产一区二区三区|