[發(fā)明專利]信息搜索方法、展示信息排序權(quán)重值確定方法及其裝置有效
| 申請(qǐng)?zhí)枺?/td> | 201210289652.2 | 申請(qǐng)日: | 2012-08-15 |
| 公開(公告)號(hào): | CN103593353B | 公開(公告)日: | 2018-11-13 |
| 發(fā)明(設(shè)計(jì))人: | 劉凱鵬 | 申請(qǐng)(專利權(quán))人: | 阿里巴巴集團(tuán)控股有限公司 |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30 |
| 代理公司: | 北京三友知識(shí)產(chǎn)權(quán)代理有限公司 11127 | 代理人: | 李輝 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 開曼群島;KY |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 信息 搜索 方法 展示 排序 權(quán)重 確定 及其 裝置 | ||
本申請(qǐng)公開了一種信息搜索方法、展示信息排序權(quán)重值確定方法及其裝置,當(dāng)信息搜索服務(wù)器根據(jù)查詢?cè)~搜索在搜索結(jié)果頁面展示的信息時(shí),依據(jù)展示信息排序模型以及點(diǎn)擊日志,確定各待展示信息的排序權(quán)重值,再根據(jù)排序權(quán)重值確定展示信息的排序。其中,展示信息排序模型基于如下假設(shè):用戶查看展示信息后點(diǎn)擊該展示信息的概率依賴于該展示信息本身,以及用戶查看展示位i上的展示信息的概率依賴于:在展示位i之前的展示位上展示信息被點(diǎn)擊的次數(shù),以及在展示位i之前的展示位當(dāng)中,其上的展示信息被點(diǎn)擊過、且距離展示位i最近的展示位位置。本申請(qǐng)可基于點(diǎn)擊數(shù)據(jù)對(duì)展示信息進(jìn)行排序時(shí),降低位置偏執(zhí)對(duì)排序的影響,提高排序合理性。
技術(shù)領(lǐng)域
本申請(qǐng)涉及通信技術(shù)領(lǐng)域,特別是涉及信息搜索方法、展示信息排序權(quán)重值確定方法及其裝置。
背景技術(shù)
信息搜索服務(wù)器為用戶提供信息搜索服務(wù)時(shí),在根據(jù)用戶輸入的查詢?cè)~返回搜索結(jié)果的同時(shí),還會(huì)在搜索結(jié)果頁面中的特定位置展示一定數(shù)量與該查詢?cè)~相關(guān)的信息,以供用戶點(diǎn)擊查看。用戶可能會(huì)在一次搜索會(huì)話(即一次搜索行為所得到的搜索結(jié)果)中點(diǎn)擊該特定位置的某些展示信息,信息搜索服務(wù)器會(huì)用日志記錄這些展示信息的展示和點(diǎn)擊情況。
用戶一般會(huì)根據(jù)展示信息的相關(guān)性進(jìn)行點(diǎn)擊,點(diǎn)擊日志反映了用戶對(duì)展示信息展示結(jié)果的相關(guān)性的隱性評(píng)價(jià)。由于點(diǎn)擊數(shù)據(jù)數(shù)量巨大,且獲取成本較低,因此,根據(jù)用戶點(diǎn)擊反饋數(shù)據(jù)準(zhǔn)確預(yù)估展示信息質(zhì)量分具有重要的應(yīng)用價(jià)值。
用戶的點(diǎn)擊行為會(huì)受到展示信息在搜索結(jié)果頁面中展示位置的影響。有研究表明,盡管相關(guān)性較差,但是,在展示位靠前位置展示的信息還是會(huì)獲得更多的點(diǎn)擊。這種影響被稱為位置偏置(Position Bias)。位置偏置的存在,增大了利用點(diǎn)擊數(shù)據(jù)準(zhǔn)確預(yù)估展示信息質(zhì)量分以對(duì)展示信息進(jìn)行排序的難度。
現(xiàn)有基于Cascade前提假設(shè)的點(diǎn)擊模型,如CCM(Click Chain Model,點(diǎn)擊鏈模型)或DBN(Dynamic Bayesian Model,動(dòng)態(tài)貝葉斯模型)等,假設(shè)用戶會(huì)從上向下查看文檔展示結(jié)果,但在實(shí)際中,用戶往往采用跳躍式的瀏覽方法,使得Cascade前提假設(shè)的適用性減弱,進(jìn)而影響點(diǎn)擊模型性能。
現(xiàn)有的不基于Cascade前提假設(shè)的點(diǎn)擊模型(如UBM,BBM等),其假設(shè)用戶查看在某位置處展示的信息的概率只與在同一展示列表中的前一次點(diǎn)擊的位置相關(guān)。這一假設(shè)沒有考慮用戶因?yàn)槎啻吸c(diǎn)擊而造成的點(diǎn)擊傾向的衰減,因而影響點(diǎn)擊模型的性能。
由此可見,目前亟需一種信息搜索方案,可以通過合理建模用戶對(duì)展示信息的點(diǎn)擊行為,消除位置偏置對(duì)信息點(diǎn)擊率統(tǒng)計(jì)的影響,根據(jù)用戶點(diǎn)擊日志數(shù)據(jù),準(zhǔn)確預(yù)估信息點(diǎn)擊反饋質(zhì)量分,從而合理的對(duì)展示信息進(jìn)行排序,提高信息搜索、展示效率。
發(fā)明內(nèi)容
本申請(qǐng)的目的在于提供一種信息搜索方法、展示信息排序權(quán)重值確定方法及其裝置,用以在基于用戶點(diǎn)擊數(shù)據(jù)對(duì)展示信息進(jìn)行排序時(shí),降低位置偏執(zhí)對(duì)排序的影響,并提高排序的合理性,提高信息搜索、展示效率,為此,本申請(qǐng)實(shí)施例采用如下技術(shù)方案:
一種信息搜索方法,包括:
接收搜索請(qǐng)求;
獲取所述搜索請(qǐng)求中攜帶的查詢?cè)~;
參考與所述查詢?cè)~相關(guān)的各待展示信息的排序權(quán)重值,將各待展示信息分配給搜索結(jié)果頁面中的信息展示位;
其中,待展示信息的排序權(quán)重值通過以下步驟確定:獲取點(diǎn)擊日志內(nèi)容,根據(jù)點(diǎn)擊日志內(nèi)容確定用戶查看搜索結(jié)果頁面中各展示位上的展示信息的概率,根據(jù)用戶查看搜索結(jié)果頁面中各展示位上的展示信息的概率,確定出與查詢?cè)~相關(guān)的各待展示信息的排序權(quán)重值;其中,用戶查看展示位i上的展示信息的概率依賴于:在展示位i之前的展示位上展示信息被點(diǎn)擊的次數(shù),以及在展示位i之前的展示位當(dāng)中,其上的展示信息被點(diǎn)擊過、且距離展示位i最近的展示位位置;
返回所述搜索結(jié)果頁面。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于阿里巴巴集團(tuán)控股有限公司,未經(jīng)阿里巴巴集團(tuán)控股有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210289652.2/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





