[發明專利]搜索方法及裝置在審
| 申請號: | 202010731110.0 | 申請日: | 2020-07-27 |
| 公開(公告)號: | CN111859138A | 公開(公告)日: | 2020-10-30 |
| 發明(設計)人: | 楊崇;秦瓊;黃恒 | 申請(專利權)人: | 小紅書科技有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/9536;G06F16/9538 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 林哲生 |
| 地址: | 200433 上海市楊浦區*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 搜索 方法 裝置 | ||
本發明提供搜索方法及裝置,以為個性化信息缺失的用戶提供個性化搜索結果。上述方法包括:獲取目標用戶當前輸入的目標搜索詞;根據目標搜索詞召回文檔;若目標用戶的個性化信息缺失,根據預置的協同過濾對應關系,確定與目標用戶對應的協同過濾用戶;其中,協同過濾對應關系包括:個性化信息缺失的用戶與搜索特征相似的協同過濾用戶之間的對應關系;任一協同過濾用戶為個性化信息完整的用戶;與目標用戶對應的協同過濾用戶為目標協同過濾用戶;根據目標協同過濾用戶的個性化信息,對召回的文檔進行排序,得到排序結果;返回排序結果作為針對目標用戶的個性化搜索結果。
技術領域
本發明涉及計算機領域,特別涉及搜索方法及裝置。
背景技術
目前的通用搜索引擎大部分對同樣的搜索詞提供同樣的搜索結果,但是在社區內容或者商品搜索的背景下,即使是同樣的搜索詞,不同的用戶尋求的搜索結果可能不盡相同。以搜索詞“襯衫”,不同性別、年齡的用戶,其尋求的搜索結果是不同的。
事實上,同一搜索詞搜索到(召回)的文檔是相同的,但對召回的文檔進行不同的排序,則會形成不同的搜索結果。對于個性化信息(例如性別、年齡等)缺失的用戶,現有的搜索方式無法為其提供個性化搜索結果。
發明內容
有鑒于此,本發明提供搜索方法及裝置,以為個性化信息缺失的用戶提供個性化搜索結果。
為了實現上述發明目的,本發明提供以下技術方案:
一種搜索方法,包括:
獲取目標用戶當前輸入的目標搜索詞;
根據所述目標搜索詞召回文檔;
若所述目標用戶的個性化信息缺失,根據預置的協同過濾對應關系,確定與所述目標用戶對應的協同過濾用戶;其中,所述協同過濾對應關系包括:個性化信息缺失的用戶與搜索特征相似的協同過濾用戶之間的對應關系;任一協同過濾用戶為個性化信息完整的用戶;與所述目標用戶對應的協同過濾用戶為目標協同過濾用戶;
根據所述目標協同過濾用戶的個性化信息,對召回的文檔進行排序,得到排序結果;
返回所述排序結果作為針對所述目標用戶的個性化搜索結果。
可選的,個性化信息缺失的用戶為第一用戶,個性化信息完整的用戶為第二用戶;在所述根據預置的協同過濾對應關系,確定所述目標用戶對應的協同過濾用戶之前,所述方法還包括:為每一所述第一用戶確定搜索特征最相似的n個第二用戶作為協同過濾用戶;n為自然數;存儲每一所述第一用戶與協同過濾用戶之間的對應關系。
可選的,任一第一用戶以第一用戶P表示;所述為每一所述第一用戶確定搜索特征最相似的n個第二用戶作為協同過濾用戶包括:計算所述第一用戶P的搜索特征向量與各第二用戶的搜索特征向量之間的相似度;其中,所述第一用戶P的搜索特征向量根據所述第一用戶P的歷史搜索詞生成,所述第二用戶的搜索特征向量根據所述第二用戶的歷史搜索詞生成;將相似度最高的n個第二用戶確定為所述第一用戶P的協同過濾用戶;所述存儲每一第一用戶與協同過濾用戶之間的對應關系包括:存儲所述第一用戶P與各協同過濾用戶之間的對應關系,以及,存儲所述第一用戶P與各協同過濾用戶之間的相似度。
可選的,所述根據所述目標協同過濾用戶的個性化信息,對召回的文檔進行排序包括:使用排序學習模型根據所述協同過濾用戶的個性化信息,對召回的各文檔進行評分,得到各文檔對應的得分;按照得分對各文檔進行排序。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于小紅書科技有限公司,未經小紅書科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010731110.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種拋光3D藍寶石手機屏用工裝夾具結構
- 下一篇:機械真空泵





