[發明專利]個性化數據搜索方法及裝置有效
| 申請號: | 201410058488.3 | 申請日: | 2014-02-20 |
| 公開(公告)號: | CN104866474B | 公開(公告)日: | 2018-10-09 |
| 發明(設計)人: | 陳曦 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京國昊天誠知識產權代理有限公司 11315 | 代理人: | 許志勇 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 開曼群島;KY |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 個性化 數據 搜索 方法 裝置 | ||
1.一種個性化數據搜索方法,其特征在于,包括:
根據當前用戶的搜索請求中的查詢詞搜索數據對象;
依據歷史行為日志,分別確定歷史用戶在利用所述查詢詞的搜索訪問過程中的第一行為特征,根據所述第一行為特征生成所述查詢詞的意圖向量,其中,所述第一行為特征是根據歷史用戶使用查詢詞獲取搜索結果后在不同類別上的行為表現或行為分布特征確定的;
根據用戶屬性,將歷史用戶分為多個用戶群體,統計每一個用戶群體對所述數據對象的第二行為特征,根據所述第二行為特征生成所述用戶群體的偏好向量;
計算所述查詢詞的意圖向量與每一用戶群體的偏好向量的相似度;
將所述相似度大于設定閾值時對應的用戶群體作為確定當前用戶的意圖偏好的參照群體;
利用所述參照群體的歷史行為特征調整所述當前用戶使用所述查詢詞搜索到的數據對象的排序。
2.根據權利要求1所述的方法,其特征在于,依據歷史行為日志,分別確定歷史用戶在利用所述查詢詞的搜索訪問過程中的第一行為特征,根據所述第一行為特征生成所述查詢詞的意圖向量的步驟,進一步包括:
根據數據對象在某一設定維度上的特征,將搜索到的數據對象劃分為一個或多個類別;
依據歷史行為日志,分別確定歷史用戶基于所述查詢詞搜索到所述數據對象并對每一個類別下的所述數據對象上發生了指定行為的次數,以所述指定行為的次數作為所述第一行為特征;
根據所述第一行為特征生成所述查詢詞的意圖向量。
3.根據權利要求2所述的方法,其特征在于,根據用戶屬性,將歷史用戶分為多個用戶群體,統計每一個用戶群體對所述數據對象的第二行為特征,根據所述第二行為特征生成所述用戶群體的偏好向量的步驟,包括:
根據用戶屬性,將歷史用戶分為多個用戶群體,統計每一個用戶群體在每一個所述類別的數據對象上發生的指定行為的次數;
依據每個數據對象在設定維度下所屬于類別,統計在該設定維度下的每個類別中的所有數據對象上由某一用戶群體的用戶進行指定行為的次數;以該用戶群體的用戶對每一個類別的數據對象進行了指定行為的次數為所述第二行為特征;
根據所述第二行為特征生成所述用戶群體的偏好向量。
4.根據權利要求1-3之一所述的方法,其特征在于,將所述相似度大于設定閾值時對應的用戶群體作為確定當前用戶的意圖偏好的參照群體的步驟,包括:
將計算得到的所述相似度,進行相關性計算以獲得相關性的值;
將相關性的值與預先設置的閾值進行比較,當所述相關性的值大于等于所述閾值時,確定當前搜索請求中的查詢詞所屬的用戶群體對應進行相似度計算的用戶群體。
5.根據權利要求1-3之一所述的方法,其特征在于,利用所述參照群體的歷史行為特征調整所述當前用戶使用所述查詢詞搜索到的數據對象的排序的步驟,包括:
根據確定當前用戶的意圖偏好的參照群體,從該參照群體中獲取用戶的特征、以及用戶的一種或多種用戶行為所對應的數據對象的特征中,選擇一項或多項特征形成的特征組合,訓練個性化模型,確定數據對象的特征針對用戶特征的個性化權重;
根據所述個性化權重,對當前搜索請求中的查詢詞所搜索到的一個或多個數據對象進行排序。
6.根據權利要求5所述的方法,其特征在于,根據所述個性化權重,對當前搜索請求中的查詢詞所搜索到的一個或多個數據對象進行排序,包括:
根據預先存儲的用戶特征和數據對象的特征,從每個用戶行為數據中提取所述當前用戶的意圖偏好的參照群體的用戶的用戶特征、以及相應的數據對象的特征;
利用所述當前用戶的意圖偏好的參照群體的用戶的用戶特征和相應的、與所述查詢詞匹配的每個數據對象的特征,與所述確定的數據對象的特征針對用戶特征的個性化權重進行匹配,得到相匹配的數據對象的特征針對用戶特征的個性化權重;
根據相匹配的所述個性化權重,預測搜索到的一個或多個數據對象的個性化分數,以根據所述個性化分數,對一個或多個數據對象進行排序。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410058488.3/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





