[發(fā)明專利]一種個性化數(shù)據(jù)搜索方法和裝置有效
| 申請?zhí)枺?/td> | 201310628812.6 | 申請日: | 2013-11-29 |
| 公開(公告)號: | CN104679771B | 公開(公告)日: | 2018-09-18 |
| 發(fā)明(設(shè)計)人: | 陳曦 | 申請(專利權(quán))人: | 阿里巴巴集團(tuán)控股有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京國昊天誠知識產(chǎn)權(quán)代理有限公司 11315 | 代理人: | 許志勇 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 開曼群島;KY |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用戶行為數(shù)據(jù) 數(shù)據(jù)對象 特征組合 搜索 個性化模型 方法和裝置 個性化數(shù)據(jù) 滿意度 權(quán)重 排序 個性化 滿意度模型 機(jī)器學(xué)習(xí) 搜索結(jié)果 搜索平臺 特征形成 用戶輸出 用戶行為 申請 展示 記錄 改進(jìn) | ||
本申請涉及一種個性化數(shù)據(jù)搜索方法和裝置。該方法包括:對用戶行為數(shù)據(jù)中記錄的用戶行為進(jìn)行機(jī)器學(xué)習(xí),獲得用戶行為數(shù)據(jù)的滿意度;選擇用戶行為數(shù)據(jù)中的用戶的特征和數(shù)據(jù)對象的特征中的一項或多項特征形成的特征組合;根據(jù)特征或特征組合下的用戶行為數(shù)據(jù)的滿意度,進(jìn)行個性化模型訓(xùn)練,獲得特征或特征組合的個性化權(quán)重;根據(jù)特征或特征組合的個性化權(quán)重,對搜索出的一個或多個數(shù)據(jù)對象進(jìn)行排序以展示一個或多個數(shù)據(jù)對象。本申請結(jié)合以往的用戶行為數(shù)據(jù)訓(xùn)練滿意度模型,進(jìn)而訓(xùn)練個性化模型,利用個性化模型對搜索出的數(shù)據(jù)對象進(jìn)行排序并展示。以此改進(jìn)和提升了搜索平臺的性能,提高了搜索結(jié)果的準(zhǔn)確性,為用戶輸出合理其符合其搜索意圖的結(jié)果。
技術(shù)領(lǐng)域
本申請涉及數(shù)據(jù)搜索領(lǐng)域,更具體地涉及一種個性化數(shù)據(jù)搜索方法和裝置。
背景技術(shù)
網(wǎng)絡(luò)中的數(shù)據(jù)量日益增加。數(shù)據(jù)搜索引擎已經(jīng)成為幫助用戶在海量數(shù)據(jù)對象中找到自己滿意數(shù)據(jù)對象的重要工具。數(shù)據(jù)搜索引擎的使用方式多種多樣,用戶可以輸入一個查詢的關(guān)鍵詞(查詢詞),在海量數(shù)據(jù)對象中篩選出與該查詢詞相匹配的搜索結(jié)果(數(shù)據(jù)對象)。但是,無論如何使用數(shù)據(jù)搜索引擎來搜索數(shù)據(jù)對象,其關(guān)鍵技術(shù)都包含對搜索出的搜索結(jié)果中所有的數(shù)據(jù)對象進(jìn)行排序的輸出處理。也即是說,用戶輸入一個查詢詞后,通過搜索找到對應(yīng)的數(shù)據(jù)對象作為搜索結(jié)果,并以一定的排序方式展示輸出這些搜索結(jié)果。現(xiàn)有技術(shù)中,數(shù)據(jù)搜索技術(shù)與用戶本身的差異或者用戶的特點(diǎn)無關(guān),僅與查詢詞有關(guān)。也就是說對不同用戶使用同一個查詢詞,搜索到的全部數(shù)據(jù)對象一致即搜索結(jié)果完全一致,并且,對搜索結(jié)果的輸出展示的排序方式相同,因而不同用戶采用同一查詢詞搜索,最后看到的搜索結(jié)果相同。
如果,同一查詢詞搜索出的搜索結(jié)果以及搜索結(jié)果的排序方式相同,則不能為不同特點(diǎn)的用戶,提供最合適、最準(zhǔn)確的搜索結(jié)果,如:不能向特定用戶提供,最符合該用戶希望的、通過其查詢詞在海量數(shù)據(jù)中找到的最準(zhǔn)確的結(jié)果。從而,導(dǎo)致對于用戶來說,搜索結(jié)果不準(zhǔn)確、不滿意,搜索平臺的性能弱、效率低,還需要用戶人工瀏覽數(shù)量龐大的搜索結(jié)果,進(jìn)而,使得后續(xù)用戶的瀏覽、訪問等用戶行為效率低,還使得對搜索到的數(shù)據(jù)對象的用戶行為減少。其中用戶的特點(diǎn)即用戶在各個維度上的特征,包括:用戶的性別、年齡、工作、偏好等。
針對上述情形個性化搜索逐漸興起。所謂個性化搜索,是指不同用戶能獲得不同的搜索結(jié)果。具體說,不同用戶采用同一查詢詞做搜索,所得到的搜索結(jié)果,由于對應(yīng)不同用戶,其會按照不同的排序方式輸出展示。這里的排序方式,考慮了用戶在一個或多個維度上的特征。而用戶的維度可以體現(xiàn)出用戶的個性。例如:性別維度,可以有男性、女性;年齡維度,可以有兒童、青年、中年、老年;網(wǎng)絡(luò)訪問頻率維度,可以有高、中、低;帳號維度,可以有帳號A、帳號B,……;等等。另外,搜索到的數(shù)據(jù)對象,在不同維度也有不同特點(diǎn)。例如:數(shù)據(jù)對象的類別可以作為維度之一,即類別維度。在類別維度上,數(shù)據(jù)對象的特征可以有體育類、人文類,等等。由于不同用戶在某一維度上可能具有不同的特征,相應(yīng)地,用戶所偏愛/關(guān)注的搜索結(jié)果中的數(shù)據(jù)對象的特征也不同。而用戶對其關(guān)注的數(shù)據(jù)對象可以通過用戶行為數(shù)據(jù)分析而得到,用戶行為數(shù)據(jù)可以包括與用戶對數(shù)據(jù)對象進(jìn)行操作所產(chǎn)生的用戶行為有關(guān)的各種數(shù)據(jù)。例如:用戶對數(shù)據(jù)對象的點(diǎn)擊、瀏覽、交互等行為。個性化搜索以用戶為出發(fā)點(diǎn),根據(jù)用戶行為數(shù)據(jù),結(jié)合用戶的特征和數(shù)據(jù)對象的特征對搜索結(jié)果中的數(shù)據(jù)對象進(jìn)行個性化排序,以滿足不同用戶對不同數(shù)據(jù)對象的需求。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于阿里巴巴集團(tuán)控股有限公司,未經(jīng)阿里巴巴集團(tuán)控股有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310628812.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種茶花止血藥
- 下一篇:一種智能廣播應(yīng)急音源播控器
- 一種用戶行為統(tǒng)計方法及系統(tǒng)
- 基于大數(shù)據(jù)的網(wǎng)絡(luò)用戶分類系統(tǒng)
- 基于大數(shù)據(jù)的網(wǎng)絡(luò)用戶分類方法
- 用戶行為數(shù)據(jù)清理方法及裝置
- 用戶行為數(shù)據(jù)的采集方法及裝置
- 用戶行為數(shù)據(jù)分析方法及服務(wù)器
- 智慧網(wǎng)點(diǎn)用戶行為分析方法及裝置、存儲介質(zhì)和終端
- 數(shù)據(jù)查詢方法和裝置
- 一種用于網(wǎng)絡(luò)環(huán)境的用戶行為預(yù)測系統(tǒng)及其方法
- 一種管理平臺中用戶行為預(yù)測方法及系統(tǒng)
- 基于對象的數(shù)據(jù)庫訪問方法
- 提高數(shù)據(jù)庫中數(shù)據(jù)對象統(tǒng)計信息可靠性的方法及裝置
- 一種移動終端得到數(shù)據(jù)對象的方法及移動終端
- 數(shù)據(jù)對象替代裝置和數(shù)據(jù)對象替代方法
- 數(shù)據(jù)對象替代裝置和數(shù)據(jù)對象替代方法
- 數(shù)據(jù)對象的處理方法及系統(tǒng)
- 一種圖像渲染方法和系統(tǒng)
- 用于回收垃圾對象數(shù)據(jù)的方法和裝置
- 對象參數(shù)權(quán)重確定方法、裝置、電子設(shè)備及可讀存儲介質(zhì)
- 互信息對抗自動編碼器





