[發(fā)明專利]一種確定搜索詞的價值的方法和裝置有效
| 申請?zhí)枺?/td> | 201410098737.1 | 申請日: | 2014-03-17 |
| 公開(公告)號: | CN104933047B | 公開(公告)日: | 2020-02-04 |
| 發(fā)明(設(shè)計)人: | 鄧欽華;許晟 | 申請(專利權(quán))人: | 北京奇虎科技有限公司;奇智軟件(北京)有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/35;G06Q30/02 |
| 代理公司: | 11276 北京市浩天知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人: | 宋菲 |
| 地址: | 100088 北京市西城區(qū)新*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 確定 搜索詞 價值 方法 裝置 | ||
1.一種確定搜索詞的價值的方法,其特征在于,包括:
將待測搜索詞的特征數(shù)據(jù)輸入價值回歸模型;
基于價值回歸模型,獲取所述待測搜索詞的價值數(shù)據(jù);
其中,所述價值回歸模型是通過如下方式獲取的:
將已有的不同搜索詞基于點擊關(guān)系數(shù)據(jù)和/或展現(xiàn)關(guān)系數(shù)據(jù)而進(jìn)行聚類,以獲得聚類后的搜索詞集合;
將搜索詞集合分類為不同價值的搜索詞集合;
利用不同價值的搜索詞集合進(jìn)行模型訓(xùn)練以獲取價值回歸模型;
將已有的不同搜索詞基于點擊關(guān)系數(shù)據(jù)和/或展現(xiàn)關(guān)系數(shù)據(jù)而進(jìn)行聚類,以獲得聚類后的搜索詞集合包括:獲取不同搜索詞的共同點擊次數(shù)并基于所述共同點擊次數(shù)計算點擊關(guān)系數(shù)據(jù)和/或獲取不同搜索詞的共同展現(xiàn)次數(shù)并基于所述共同展現(xiàn)次數(shù)計算展現(xiàn)關(guān)系數(shù)據(jù);
基于所述點擊關(guān)系數(shù)據(jù)、展現(xiàn)關(guān)系數(shù)據(jù)、共同展現(xiàn)次數(shù)和共同點擊次數(shù)中的至少一個,計算已有搜索詞之間的聚類距離;
基于所述聚類距離將已有搜索詞進(jìn)行聚類,以獲得聚類后的搜索詞集合。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述不同價值的搜索詞集合包括高價值的搜索詞集合、中價值的搜索詞集合以及低價值的搜索詞集合,其中高價值的搜索詞集合中搜索詞的價值數(shù)據(jù)大于中價值的搜索詞集合中搜索詞的價值數(shù)據(jù);以及中價值的搜索詞集合中搜索詞的價值數(shù)據(jù)大于低價值的搜索詞集合中搜索詞的價值數(shù)據(jù)。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,高價值的搜索詞集合中搜索詞的價值數(shù)據(jù)為1、中價值的搜索詞集合中搜索詞的價值數(shù)據(jù)為0.5以及低價值的搜索詞集合中搜索詞的價值數(shù)據(jù)為0。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,共同點擊次數(shù)、共同展現(xiàn)次數(shù)、點擊關(guān)系數(shù)據(jù)、展現(xiàn)關(guān)系數(shù)據(jù)分別表示兩個搜索詞之間的共同點擊次數(shù)、共同展現(xiàn)次數(shù)、點擊關(guān)系數(shù)據(jù)、展現(xiàn)關(guān)系數(shù)據(jù)。
5.根據(jù)權(quán)利要求2所述的方法,其特征在于,利用不同價值的搜索詞集合進(jìn)行模型訓(xùn)練以獲取價值回歸模型,進(jìn)一步包括:將每個搜索詞集合中的每個搜索詞作為一份對應(yīng)該搜索詞集合的價值數(shù)據(jù)的樣本,具體地,
將高價值的搜索詞集合中的每個搜索詞作為一份2樣本、中價值的搜索詞集合中的每個搜索詞作為一份1樣本并且低價值的搜索詞集合中的每個搜索詞作為一份0樣本利用邏輯回歸算法進(jìn)行訓(xùn)練以形成所述價值回歸模型。
6.一種確定搜索詞的價值的裝置,其特征在于,包括:
輸入模塊,用于將待測搜索詞的特征數(shù)據(jù)輸入價值回歸模型;
獲取模塊,用于基于價值回歸模型,獲取所述待測搜索詞的價值數(shù)據(jù);
其中,所述價值回歸模型是通過如下模塊獲取的:
聚類模塊,包括關(guān)系數(shù)據(jù)獲取子模塊、計算子模塊及獲取子模塊;關(guān)系數(shù)據(jù)獲取子模塊,用于獲取不同搜索詞的共同點擊次數(shù)并基于所述共同點擊次數(shù)計算點擊關(guān)系數(shù)據(jù)和/或獲取不同搜索詞的共同展現(xiàn)次數(shù)基于所述共同展現(xiàn)次數(shù)計算展現(xiàn)關(guān)系數(shù)據(jù);
計算子模塊,用于基于所述點擊關(guān)系數(shù)據(jù)、展現(xiàn)關(guān)系數(shù)據(jù)、共同展現(xiàn)次數(shù)和共同點擊次數(shù)中的至少一個,計算已有搜索詞之間的聚類距離;以及
獲取子模塊,用于基于所述聚類距離將已有搜索詞進(jìn)行聚類,以獲得聚類后的搜索詞集合;
分類模塊,用于將搜索詞集合分類為不同價值的搜索詞集合;
模型獲取模塊,用于利用不同價值的搜索詞集合進(jìn)行模型訓(xùn)練以獲取價值回歸模型。
7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述不同價值的搜索詞集合包括高價值的搜索詞集合、中價值的搜索詞集合以及低價值的搜索詞集合,其中高價值的搜索詞集合中搜索詞的價值數(shù)據(jù)大于中價值的搜索詞集合中搜索詞的價值數(shù)據(jù);以及中價值的搜索詞集合中搜索詞的價值數(shù)據(jù)大于低價值的搜索詞集合中搜索詞的價值數(shù)據(jù)。
8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,高價值的搜索詞集合中搜索詞的價值數(shù)據(jù)為1、中價值的搜索詞集合中搜索詞的價值數(shù)據(jù)為0.5以及低價值的搜索詞集合中搜索詞的價值數(shù)據(jù)為0。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京奇虎科技有限公司;奇智軟件(北京)有限公司,未經(jīng)北京奇虎科技有限公司;奇智軟件(北京)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410098737.1/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





