[發明專利]一種詞條權重的計算方法、搜索方法及相關裝置有效
| 申請號: | 201910203912.1 | 申請日: | 2019-03-18 |
| 公開(公告)號: | CN109933714B | 公開(公告)日: | 2021-04-20 |
| 發明(設計)人: | 石翔;陳煒鵬;許靜芳 | 申請(專利權)人: | 北京搜狗科技發展有限公司 |
| 主分類號: | G06F16/953 | 分類號: | G06F16/953;G06F16/18;G06F16/33;G06F40/289 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 朱靜 |
| 地址: | 100084 北京市海淀區中關*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 詞條 權重 計算方法 搜索 方法 相關 裝置 | ||
1.一種詞條權重的計算方法,其特征在于,所述方法包括:
針對用戶點擊日志數據中的搜索詞,構建相似搜索詞集合,其中,相似搜索詞集合中的各搜索詞為所述點擊日志數據中點擊到同一搜索結果項的搜索詞;
針對相似搜索詞集合中包括的每個搜索詞,計算得到每個搜索詞對應的搜索結果點擊率;其中,所述搜索結果點擊率為搜索詞針對其所屬相似搜索詞集合對應的搜索結果項的點擊率;
以所述相似搜索詞集合中的一搜索詞作為第一搜索詞,依據第一搜索詞所屬相似搜索詞集合包括的各搜索詞分別對應的搜索結果點擊率,計算所述第一搜索詞與其所屬相似搜索詞集合中各搜索詞之間的相關程度;
對所述第一搜索詞進行分詞,得到所述第一搜索詞包括的至少一個分詞詞條;
針對所述第一搜索詞包括的各分詞詞條,依據所述第一搜索詞與其所屬相似搜索詞集合中各搜索詞之間的相關程度,計算得到所述第一搜索詞包括的每個分詞詞條的詞條權重。
2.根據權利要求1所述的方法,其特征在于,所述計算得到每個搜索詞對應的搜索結果點擊率包括:
獲取以所述搜索詞進行搜索時,所述搜索詞所屬相似搜索詞集合對應的搜索結果項被點擊的次數,記為第一次數;
獲取所述搜索詞被搜索的次數,記為第二次數;
將所述第一次數與第二次數的比值作為所述搜索詞對應的搜索結果點擊率。
3.根據權利要求1所述的方法,其特征在于,所述依據第一搜索詞所屬相似搜索詞集合包括的各搜索詞分別對應的搜索結果點擊率,計算所述第一搜索詞與其所屬相似搜索詞集合中各搜索詞之間的相關程度后,所述方法還包括:
對所述第一搜索詞與其所屬相似搜索詞集合中各搜索詞之間的相關程度進行歸一化處理;
所述依據所述第一搜索詞與其所屬相似搜索詞集合中各搜索詞之間的相關程度,計算得到所述第一搜索詞包括的各個分詞詞條的詞條權重,包括:
依據歸一化處理后所述第一搜索詞與其所屬相似搜索詞集合中各搜索詞之間的相關程度,計算得到所述第一搜索詞包括的各個分詞詞條的詞條權重。
4.根據權利要求3所述的方法,其特征在于,所述對所述第一搜索詞與其所屬相似搜索詞集合中各搜索詞之間的相關程度進行歸一化處理,包括:
其中,weight(query,qanchor)表示所述第一搜索詞與其所屬相似搜索詞集合中任一搜索詞之間的相關程度;query表示所述第一搜索詞,qanchor表示相似搜索詞集合中的任一搜索詞;click(query,doci)表示所述第一搜索詞針對其所屬第i個相似搜索詞集合對應的搜索結果項的點擊率,n為所述第一搜索詞所屬相似搜索詞集合的個數;click(query)表示所述第一搜索詞針對其所屬相似搜索詞集合對應的搜索結果項的點擊率之和;click(qanchor,doci)表示所述任一搜索詞針對其所屬相似搜索詞集合對應的搜索結果項的點擊率;click(doci)表示所述第一搜索詞所屬第i個相似搜索詞集合中所有搜索詞對應的搜索結果點擊率之和。
5.根據權利要求3所述的方法,其特征在于,所述依據歸一化處理后所述第一搜索詞與其所屬相似搜索詞集合中各搜索詞之間的相關程度,計算得到所述第一搜索詞包括的每個分詞詞條的詞條權重,包括:
獲取所述第一搜索詞所屬相似搜索詞集合中所有包括所述分詞詞條的第二搜索詞;
獲取歸一化處理后所述第一搜索詞與每個第二搜索詞之間的相關程度并進行求和計算,將計算結果作為所述第一搜索詞包括的所述分詞詞條的詞條權重。
6.根據權利要求1所述的方法,其特征在于,所述針對用戶點擊日志數據中的搜索詞,構建相似搜索詞集合之前,所述方法還包括:
獲取所述用戶點擊日志數據中搜索詞指向的搜索點擊結果集合;
針對搜索點擊結果集合中每個搜索結果項,分別將點擊到同一搜索結果項的搜索詞組成相似搜索詞集合。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京搜狗科技發展有限公司,未經北京搜狗科技發展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910203912.1/1.html,轉載請聲明來源鉆瓜專利網。





