[發明專利]一種基于用戶點擊數據的關鍵詞屬性量化方法及裝置無效
| 申請號: | 201210133409.1 | 申請日: | 2012-05-02 |
| 公開(公告)號: | CN103383685A | 公開(公告)日: | 2013-11-06 |
| 發明(設計)人: | 劉建柱;賈自艷 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京德琦知識產權代理有限公司 11018 | 代理人: | 謝安昆;宋志強 |
| 地址: | 518044 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 用戶 點擊 數據 關鍵詞 屬性 量化 方法 裝置 | ||
技術領域
本發明涉及網頁搜索技術領域,特別涉及一種基于用戶點擊數據的關鍵詞屬性量化方法及裝置。
背景技術
對于網頁搜索引擎來說,根據用戶輸入的關鍵詞,給出搜索結果是網頁搜索引擎最主要的功能,而在對搜索結果進行合理排序時,則離不開對于用戶搜索的關鍵詞的量化數據;其中,比較典型的如對用戶搜索的關鍵詞的某種屬性進行量化打分,從而實現基于該屬性的排序,例如對關鍵詞的商業度進行打分,從而實現對搜索結果的商業相關性排序、廣告支持、作弊站點識別、相關性商業展示排序調整等。
現有的關鍵詞屬性量化方法主要是通過一套字符串規則對關鍵詞進行匹配,按照匹配度進行打分,從而得到關鍵詞某一屬性的量化數據,并基于該量化數據進行排序。
但是,由于現有的量化方法缺乏對用戶搜索行為的分析,對關鍵詞屬性的量化區分度不高,同時對一些表述復雜的字符串、長字符串以及未覆蓋關鍵詞的查詢串識別能力不夠,關鍵詞屬性的量化數據可比性不高,對于后續的排序等應用幫助不大,達不到很好的量化效果。
發明內容
有鑒于此,本發明提供了一種基于用戶點擊數據的關鍵詞屬性量化方法及裝置,能夠得到更加精準的關鍵詞屬性量化數據。
為達上述目的,本發明的技術方案具體是這樣實現的:
一種基于用戶點擊數據的關鍵詞屬性量化方法,該方法包括:
獲取用于進行屬性量化的候選關鍵詞的集合;
分別確定所述關鍵詞及其對應的搜索結果鏈接的量化打分算法,將所述搜索結果鏈接的分數作為所述關鍵詞的量化打分結果的影響因素;將所述關鍵詞的分數作為所述搜索結果鏈接的量化打分結果的影響因素,建立所述關鍵詞的迭代量化模型;
根據所述關鍵詞及對應的搜索結果鏈接之間的點擊數據及所述量化模型對所述關鍵詞對應的搜索結果鏈接進行量化打分;再通過迭代計算,得到關鍵詞的所述屬性的量化數據。
較佳地,所述屬性為商業度。
較佳地,所述獲取用于進行屬性量化的候選關鍵詞的集合,包括:
抓取電商網站標題和商品垂直頻道關鍵詞作為候選關鍵詞;
從所述候選關鍵詞中選取出現頻次最高的N條關鍵詞作為商業度屬性量化的候選關鍵詞;
其中N為正整數。
較佳地,所述迭代量化模型包括:
T(x)表示和x相關的所有用戶點擊次數之和,其中,x可以為關鍵詞或者對應的搜索結果鏈接;
當x為關鍵詞時,x→yi表示用戶搜索關鍵詞(x)時,得到的搜索結果鏈接中,用戶點擊過的某鏈接的點擊次數,此時T(x)表示用戶搜索關鍵詞(x)時,點擊過的所有搜索結果鏈接的點擊次數之和;
當x為搜索結果鏈接時,x→yi表示用戶通過不同關鍵詞搜索到的同一搜索結果鏈接的點擊次數;此時T(x)表示,用戶通過所有不同關鍵詞搜索到的同一搜索結果鏈接的點擊次數之和;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210133409.1/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





