[發(fā)明專利]搜索質(zhì)量評估方法及裝置有效
| 申請?zhí)枺?/td> | 201610645103.2 | 申請日: | 2016-08-09 |
| 公開(公告)號: | CN107704467B | 公開(公告)日: | 2021-08-24 |
| 發(fā)明(設(shè)計)人: | 曹皓;張亮;齊志宏;賈晉康;覃安 | 申請(專利權(quán))人: | 百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司 |
| 主分類號: | G06F16/951 | 分類號: | G06F16/951;G06F16/9535 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆;胡彬 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 搜索 質(zhì)量 評估 方法 裝置 | ||
1.一種搜索質(zhì)量評估方法,其特征在于,包括:
基于用戶歷史搜索記錄數(shù)據(jù)構(gòu)造搜索質(zhì)量評估數(shù)據(jù)庫,所述搜索質(zhì)量評估數(shù)據(jù)庫包含至少一個查詢關(guān)鍵詞、對應(yīng)的至少一個搜索結(jié)果項以及針對所述搜索結(jié)果項的用戶操作特征數(shù)據(jù);
針對所述至少一個查詢關(guān)鍵詞中的每個查詢關(guān)鍵詞,基于基線搜索策略和待評估搜索策略,分別對所述搜索質(zhì)量評估數(shù)據(jù)庫中的對應(yīng)搜索結(jié)果項進行排序得到第一排序結(jié)果和第二排序結(jié)果;
基于所述用戶歷史操作特征數(shù)據(jù)、所述第一排序結(jié)果和所述第二排序結(jié)果對所述待評估搜索策略的搜索質(zhì)量進行評估;
其中,基于所述用戶歷史操作特征數(shù)據(jù)、所述第一排序結(jié)果和所述第二排序結(jié)果對所述待評估搜索策略的搜索質(zhì)量進行評估包括:
基于所述第一排序結(jié)果和第二排序結(jié)果,確定出存在同一排序位置對應(yīng)不同搜索結(jié)果項情形的排序位置;
將所述排序位置上的不同搜索結(jié)果項組成位置差異搜索結(jié)果對;
基于所述位置差異搜索結(jié)果對以及對應(yīng)的用戶操作特征數(shù)據(jù),對所述待評估搜索策略進行評估。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,基于用戶歷史搜索記錄數(shù)據(jù)構(gòu)造搜索質(zhì)量評估數(shù)據(jù)庫包括:
從用戶歷史搜索記錄數(shù)據(jù)中抽取所述至少一個查詢關(guān)鍵詞;
從用戶歷史搜索記錄數(shù)據(jù)中,提取與所抽取的查詢關(guān)鍵詞對應(yīng)的搜索結(jié)果項的用戶操作特征數(shù)據(jù);
將所述至少一個查詢關(guān)鍵詞、對應(yīng)的搜索結(jié)果項以及所述搜索結(jié)果項的用戶操作特征數(shù)據(jù)作為所述搜索質(zhì)量評估數(shù)據(jù)。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,在從用戶歷史搜索記錄數(shù)據(jù)中,提取與所抽取的查詢關(guān)鍵詞對應(yīng)的搜索結(jié)果項的用戶操作特征數(shù)據(jù)后,所述方法還包括:
基于預(yù)定的搜索結(jié)果項篩選策略,對所述搜索結(jié)果項進行篩選處理,其中所述搜索結(jié)果項篩選策略與用戶操作特征數(shù)據(jù)相關(guān)聯(lián)。
4.根據(jù)權(quán)利要求1-3中任一所述的方法,其特征在于,所述用戶歷史搜索記錄數(shù)據(jù)包括用戶點擊日志,以及所述用戶操作特征數(shù)據(jù)包括用戶歷史點擊數(shù)據(jù)。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,針對所述至少一個查詢關(guān)鍵詞中的每個查詢關(guān)鍵詞,基于基線搜索策略和待評估搜索策略,分別對所述搜索質(zhì)量評估數(shù)據(jù)庫中的對應(yīng)搜索結(jié)果項進行排序得到第一排序結(jié)果和第二排序結(jié)果包括:
針對所述至少一個查詢關(guān)鍵詞中的每個查詢關(guān)鍵詞,提取對應(yīng)搜索結(jié)果項的頁面特征;
從所提取的頁面特征中,獲取基線策略特征和待評估策略特征;
基于所述基線策略特征和待評估策略特征以及對應(yīng)的基線策略模型和待評估策略模型,對所述搜索結(jié)果項進行排序來獲得所述第一排序結(jié)果和所述第二排序結(jié)果。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,基于所述差異搜索結(jié)果對以及對應(yīng)的用戶操作特征數(shù)據(jù),對所述待評估搜索策略進行評估包括:
基于每個位置差異搜索結(jié)果對以及對應(yīng)的用戶操作特征數(shù)據(jù),確定模擬搜索環(huán)境中的每次點擊時所述差異搜索結(jié)果對中被擊中的搜索結(jié)果;
統(tǒng)計模擬搜索環(huán)境下每個位置差異搜索結(jié)果對中的各個搜索結(jié)果的點擊結(jié)果;
基于所統(tǒng)計的點擊結(jié)果,對所述待評估搜索策略進行評估。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,統(tǒng)計模擬搜索環(huán)境下每個位置差異搜索結(jié)果對中的各個搜索結(jié)果的點擊結(jié)果包括:
統(tǒng)計點擊第一排序結(jié)果中的搜索結(jié)果項的次數(shù)多于點擊第二排序結(jié)果中的搜索結(jié)果項的次數(shù)的總次數(shù)G;
統(tǒng)計點擊第一排序結(jié)果中的搜索結(jié)果項的次數(shù)少于點擊第二排序結(jié)果中的搜索結(jié)果項的次數(shù)的總次數(shù)B;
統(tǒng)計點擊第一排序結(jié)果中的搜索結(jié)果項的次數(shù)等于點擊第二排序結(jié)果中的搜索結(jié)果項的次數(shù)的總次數(shù)S。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,基于所統(tǒng)計的點擊結(jié)果,對所述待評估搜索策略進行評估包括:
基于所統(tǒng)計的次數(shù)G、B和S,計算所述待評估搜索策略的評估系數(shù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司,未經(jīng)百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610645103.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





