[發明專利]獲取與頁面相關的搜索詞的方法、裝置和系統有效
| 申請號: | 201710391699.2 | 申請日: | 2017-05-27 |
| 公開(公告)號: | CN107193987B | 公開(公告)日: | 2020-12-29 |
| 發明(設計)人: | 蔡建山 | 申請(專利權)人: | 阿里巴巴(中國)有限公司 |
| 主分類號: | G06F16/953 | 分類號: | G06F16/953;G06F16/9535 |
| 代理公司: | 北京展翼知識產權代理事務所(特殊普通合伙) 11452 | 代理人: | 屠長存 |
| 地址: | 310052 浙江省杭州市濱江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 獲取 頁面 相關 搜索詞 方法 裝置 系統 | ||
1.一種針對當前瀏覽頁面推薦相關搜索詞的方法,包括:
分析用戶的瀏覽日志,以從所述瀏覽日志中識別出用戶的搜索行為記錄和瀏覽行為記錄;
從所述搜索行為記錄中提取對應的搜索詞,從所述瀏覽行為記錄中提取對應的頁面識別信息;
基于所述用戶的瀏覽日志中所述搜索行為記錄和所述瀏覽行為記錄之間的關聯關系,確定與所述頁面識別信息對應的搜索詞子列表,所述搜索詞子列表中包括與對應于所述頁面識別信息的瀏覽行為記錄相關聯的搜索行為記錄所對應的搜索詞,所述搜索詞子列表包括后置搜索詞子列表,所述后置搜索詞子列表包括后置搜索詞,所述后置搜索詞是在對應于所述頁面識別信息的瀏覽行為記錄之后發生并與該瀏覽行為記錄相關聯的搜索行為記錄所對應的搜索詞;
提供當前瀏覽頁面的頁面識別信息對應的后置搜索詞子列表中的至少一個后置搜索詞。
2.根據權利要求1所述的方法,還包括:
聚合從多個用戶的瀏覽日志獲取的搜索詞子列表,以得到與各個頁面識別信息分別對應的搜索詞合并列表。
3.根據權利要求2所述的方法,還包括:
對所述搜索詞子列表中的各個搜索詞分別設置權重,
并且,所述聚合從多個用戶的瀏覽日志獲取的搜索詞子列表的步驟包括:
對于同一個頁面識別信息,基于從所述多個用戶的瀏覽日志獲取的與其對應的搜索詞的權重,得到所述搜索詞在所述搜索詞合并列表中的總權重;以及
基于所述總權重對與所述同一個頁面識別信息對應的所述搜索詞合并列表中的搜索詞排序。
4.根據權利要求3所述的方法,其中,
基于所述搜索詞的輸入方式來設置所述權重;并且/或者基于所述搜索詞對應的搜索行為記錄與所述頁面識別信息對應的瀏覽行為記錄之間的時間間隔和/或間隔的搜索行為記錄和/或瀏覽行為記錄數量來設置所述權重。
5.根據權利要求1所述的方法,其中,所述分析用戶的瀏覽日志以從所述瀏覽日志中識別出用戶的搜索行為記錄和瀏覽行為記錄的步驟包括:
根據頁面的HOST及URL特征、請求參數,并且/或者根據頁面的標題,從所述瀏覽日志中識別出所述用戶的搜索行為和瀏覽行為。
6.根據權利要求1-5中任何一項所述的方法,其中,
所述搜索詞子列表還包括前置搜索詞子列表,
所述前置搜索詞子列表包括前置搜索詞,所述前置搜索詞是在對應于所述頁面識別信息的瀏覽行為記錄之前發生并與該瀏覽行為記錄相關聯的搜索行為記錄所對應的搜索詞。
7.根據權利要求6所述的方法,其中,所述基于所述搜索行為記錄和所述瀏覽行為記錄之間的關聯關系,確定與所述頁面識別信息對應的搜索詞子列表的步驟包括:
將同一個用戶的瀏覽日志中的行為記錄劃分成一個或多個會話,使得每個會話滿足以下至少一項條件:會話中的第一條行為記錄與最后一條行為記錄之間的時間差不大于第一閾值;和/或會話中相鄰兩條行為記錄之間的時間間隔不大于第二閾值;和/或會話中的搜索行為記錄和/或瀏覽行為記錄的數量不大于第三閾值,其中,所述行為記錄包括所述搜索行為記錄和所述瀏覽行為記錄;
將同一個會話中,瀏覽行為記錄之前的所有搜索行為記錄對應的搜索詞確定為所述瀏覽行為記錄對應的頁面識別信息的所述前置搜索詞;
將同一個會話中,瀏覽行為記錄之后的所有搜索行為記錄對應的搜索詞確定為所述瀏覽行為記錄對應的頁面識別信息的所述后置搜索詞。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴(中國)有限公司,未經阿里巴巴(中國)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710391699.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種電子元件銷售用展示盒
- 下一篇:一種計算機展示體驗臺





