[發明專利]訪問意圖挖掘方法及裝置有效
| 申請號: | 201810719792.6 | 申請日: | 2018-07-03 |
| 公開(公告)號: | CN110737823B | 公開(公告)日: | 2022-06-24 |
| 發明(設計)人: | 沈璠;王曉元;馬宇峰;葉峻 | 申請(專利權)人: | 百度在線網絡技術(北京)有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/955 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 宋合成 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 訪問 意圖 挖掘 方法 裝置 | ||
本發明提出一種訪問意圖挖掘方法及裝置,其中方法包括:獲取用戶在網站上的至少一個訪問行為;其中包括:用戶此次訪問的第一個頁面地址,和/或,用戶此次訪問所采用的檢索詞;根據頁面地址和/或檢索詞,查詢預設的意圖庫,獲取頁面地址對應的訪問意圖,和/或,檢索詞對應的訪問意圖;意圖庫中包括:各個頁面地址對應的訪問意圖,以及各個檢索詞對應的訪問意圖;根據頁面地址對應的訪問意圖,和/或,檢索詞對應的訪問意圖,確定用戶的訪問意圖,從而能夠直接根據用戶的檢索詞和/或訪問的頁面地址,確定用戶的訪問意圖,降低了訪問意圖挖掘的人工成本,且能夠準確確定用戶的訪問意圖,準確確定網站的意圖分布,提高了訪問意圖挖掘的效率。
技術領域
本發明涉及數據處理技術領域,尤其涉及一種訪問意圖挖掘方法及裝置。
背景技術
目前的訪問意圖挖掘方法主要為,網站運營人員對每個網頁進行主題標注,根據用戶訪問過的網頁的主題來確定用戶的訪問意圖。上述方法中,需要人員對網頁進行人工標注,且用戶打開的部分網頁并不是用戶想要瀏覽的網頁,根據網頁的主題,不能確定用戶的訪問意圖的強烈程度,從而難以準確確定用戶的到訪意圖,進而難以確定網站的意圖分布,降低了訪問意圖挖掘的效率。
發明內容
本發明旨在至少在一定程度上解決相關技術中的技術問題之一。
為此,本發明的第一個目的在于提出一種訪問意圖挖掘方法,用于解決現有技術中難以準確確定用戶的訪問意圖的問題。
本發明的第二個目的在于提出一種訪問意圖挖掘裝置。
本發明的第三個目的在于提出一種電子設備。
本發明的第四個目的在于提出一種非臨時性計算機可讀存儲介質。
本發明的第五個目的在于提出一種計算機程序產品。
為達上述目的,本發明第一方面實施例提出了一種訪問意圖挖掘方法,包括:
獲取用戶在網站上的至少一個訪問行為;所述訪問行為中包括:用戶此次訪問的第一個頁面地址,和/或,用戶此次訪問所采用的檢索詞;
根據所述頁面地址和/或所述檢索詞,查詢預設的意圖庫,獲取所述頁面地址對應的訪問意圖,和/或,所述檢索詞對應的訪問意圖;所述意圖庫中包括:各個頁面地址對應的訪問意圖,以及各個檢索詞對應的訪問意圖;
根據所述頁面地址對應的訪問意圖,和/或,所述檢索詞對應的訪問意圖,確定所述用戶對所述網站的訪問意圖。
進一步的,所述的方法還包括:
獲取預設歷史時間段內所述用戶在所述網站上的檢索行為;所述檢索行為包括:檢索詞與目標頁面地址的對應關系;所述目標頁面地址,為所述用戶在頁面上輸入所述檢索詞后所打開的頁面的地址;
針對所述檢索行為,獲取所述檢索行為中的所有檢索詞,從所有檢索詞中提取意圖詞;
針對每個目標頁面地址,獲取與所述目標頁面地址對應的至少一個檢索詞,從所述至少一個檢索詞中提取關鍵詞;
在存在與所述關鍵詞匹配的意圖詞時,將所述關鍵詞確定為所述目標頁面地址對應的訪問意圖,以及將所述關鍵詞確定為所述至少一個檢索詞對應的訪問意圖,生成所述意圖庫。
進一步的,所述從所有檢索詞中提取意圖詞,包括:
針對所有檢索詞中的每個檢索詞,獲取所述檢索詞的相關信息;所述信息包括以下信息中的任意一個或者多個:詞頻、詞性、詞長度;
根據所述檢索詞的相關信息,確定所述檢索詞是否為意圖詞。
進一步的,所述生成所述意圖庫之后,還包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度在線網絡技術(北京)有限公司,未經百度在線網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810719792.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:用戶興趣挖掘方法、裝置、設備和存儲介質
- 下一篇:內容查詢方法和裝置





