[發(fā)明專利]一種確定搜索需求強(qiáng)度的方法、需求識(shí)別的方法及其裝置有效
| 申請(qǐng)?zhí)枺?/td> | 201110449432.7 | 申請(qǐng)日: | 2011-12-29 |
| 公開(公告)號(hào): | CN103186573A | 公開(公告)日: | 2013-07-03 |
| 發(fā)明(設(shè)計(jì))人: | 黃際洲;柴春光 | 申請(qǐng)(專利權(quán))人: | 北京百度網(wǎng)訊科技有限公司 |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30 |
| 代理公司: | 北京鴻德海業(yè)知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11412 | 代理人: | 袁媛 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 確定 搜索 需求 強(qiáng)度 方法 識(shí)別 及其 裝置 | ||
1.一種確定搜索需求強(qiáng)度的方法,其特征在于,所述方法包括:
A.提取搜索日志中的查詢歸屬于預(yù)設(shè)需求類別的相似度特征及點(diǎn)擊特征中的至少一個(gè)特征,其中所述查詢歸屬于預(yù)設(shè)需求類別的相似度特征用于表征所述查詢與所述預(yù)設(shè)需求類別之間的語義相似度,所述查詢歸屬于預(yù)設(shè)需求類別的點(diǎn)擊特征用于表征所述查詢引起的點(diǎn)擊頁面屬于所述預(yù)設(shè)需求類別的可能性;
B.根據(jù)提取的每個(gè)特征及每個(gè)特征的權(quán)重計(jì)算所述查詢歸屬于所述預(yù)設(shè)需求類別的得分,并利用所述查詢歸屬于所述預(yù)設(shè)需求類別的得分得到所述查詢?cè)谒鲱A(yù)設(shè)需求類別的強(qiáng)度。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,提取所述查詢歸屬于預(yù)設(shè)需求類別的相似度特征的步驟包括:
獲取所述預(yù)設(shè)需求類別的核心詞向量;
獲取所述查詢的核心詞向量;
計(jì)算所述查詢的核心詞向量與所述預(yù)設(shè)需求類別的核心詞向量之間的余弦相似度,得到所述查詢歸屬于所述預(yù)設(shè)需求類別的相似度特征。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,獲取所述預(yù)設(shè)需求類別的核心詞向量的步驟包括:
獲取所述預(yù)設(shè)需求類別的種子查詢;
從所述預(yù)設(shè)需求類別的種子查詢及所述預(yù)設(shè)需求類別的種子查詢得到的點(diǎn)擊頁面中提取核心詞;
確定提取的各核心詞在所述預(yù)設(shè)需求類別的核心詞向量中所占的權(quán)重,以生成所述預(yù)設(shè)需求類別的核心詞向量。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,獲取所述預(yù)設(shè)需求類別的種子查詢的方式至少包括以下方式中的一種:
方式一、將搜索日志中人工標(biāo)注為所述預(yù)設(shè)需求類別的查詢作為所述預(yù)設(shè)需求類別的種子查詢;或者
方式二:將搜索日志中與人工標(biāo)注為所述預(yù)設(shè)需求類別的查詢引起了相同點(diǎn)擊頁面的查詢作為所述預(yù)設(shè)需求類別的種子查詢。
5.根據(jù)權(quán)利要求2所述的方法,其特征在于,獲取所述查詢的核心詞向量的步驟包括:
從所述查詢及所述查詢得到的點(diǎn)擊頁面中提取核心詞;
確定提取的各核心詞在所述查詢的核心詞向量中所占的權(quán)重,以生成所述查詢的核心詞向量。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,提取所述查詢歸屬于預(yù)設(shè)需求類別的點(diǎn)擊特征的步驟包括:
對(duì)所述查詢引起的各點(diǎn)擊頁面的內(nèi)容按照需求進(jìn)行分類,以確定各點(diǎn)擊頁面所屬需求類別;
統(tǒng)計(jì)屬于所述預(yù)設(shè)需求類別的點(diǎn)擊頁面數(shù)量;
以所述查詢屬于所述預(yù)設(shè)需求類別的點(diǎn)擊頁面數(shù)量與所述查詢引起的所有點(diǎn)擊頁面數(shù)量的比值作為所述查詢歸屬于所述預(yù)設(shè)需求類別的點(diǎn)擊特征。
7.一種需求識(shí)別的方法,其特征在于,所述方法包括:
獲取線上查詢;
確定搜索日志中與所述線上查詢最相似的線下查詢;
將確定的線下查詢的各需求類別強(qiáng)度中大于預(yù)設(shè)值的需求類別強(qiáng)度所對(duì)應(yīng)的需求類別作為所述線上查詢具有的需求,其中線下查詢的各需求類別強(qiáng)度是采用權(quán)利要求1至6中任一權(quán)項(xiàng)所述的確定搜索需求強(qiáng)度的方法得到的。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述方法進(jìn)一步包括:
向用戶返回與所述線上查詢具有的需求相關(guān)的頁面;或者
向用戶返回與所述線上查詢具有的需求相關(guān)的推薦詞。
9.一種確定搜索需求強(qiáng)度的裝置,其特征在于,所述裝置包括:
相似度特征提取單元或點(diǎn)擊特征提取單元中的至少一個(gè),其中相似度特征提取單元用于提取搜索日志中的查詢歸屬于預(yù)設(shè)需求類別的相似度特征,點(diǎn)擊特征提取單元用于提取搜索日志中的查詢歸屬于所述預(yù)設(shè)需求類別的點(diǎn)擊特征,所述查詢歸屬于所述預(yù)設(shè)需求類別的相似度特征用于表征所述查詢與所述預(yù)設(shè)需求類別之間的語義相似度,所述查詢歸屬于所述預(yù)設(shè)需求類別的點(diǎn)擊特征用于表征所述查詢引起的點(diǎn)擊頁面屬于所述預(yù)設(shè)需求類別的可能性;
計(jì)算單元,用于根據(jù)提取的每個(gè)特征及每個(gè)特征的權(quán)重計(jì)算所述查詢歸屬于所述預(yù)設(shè)需求類別的得分,并利用所述查詢歸屬于所述預(yù)設(shè)需求類別的得分得到所述查詢?cè)谒鲱A(yù)設(shè)需求類別的強(qiáng)度。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京百度網(wǎng)訊科技有限公司,未經(jīng)北京百度網(wǎng)訊科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110449432.7/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 需求控制系統(tǒng)、需求控制器、需求程序以及需求控制方法
- 需求控制裝置、需求控制系統(tǒng)以及需求控制程序
- 需求響應(yīng)方法和需求響應(yīng)系統(tǒng)
- 需求預(yù)測裝置、需求預(yù)測方法以及需求預(yù)測程序
- 電力需求調(diào)整系統(tǒng)、電力需求調(diào)整裝置及電力需求調(diào)整方法
- 軟件需求審核方法以及需求審核系統(tǒng)
- 電力需求控制裝置、電力需求控制方法及電力需求控制系統(tǒng)
- 電力需求控制裝置及電力需求控制方法
- 需求監(jiān)視裝置、需求監(jiān)視系統(tǒng)、需求監(jiān)視方法和需求監(jiān)視程序
- 需求管理方法和需求管理系統(tǒng)
- 骨強(qiáng)度診斷裝置及骨強(qiáng)度診斷方法
- 復(fù)合袋封口強(qiáng)度、耐壓強(qiáng)度及耐破強(qiáng)度測試裝置
- 一種強(qiáng)度磚強(qiáng)度檢測設(shè)備
- 高強(qiáng)度螺栓剪切強(qiáng)度演示裝置
- 高強(qiáng)度螺栓的強(qiáng)度增加方法
- 強(qiáng)度檢測裝置以及強(qiáng)度檢測方法
- 凝集強(qiáng)度判讀儀和凝集強(qiáng)度判讀架
- 高強(qiáng)度玻璃用檢測強(qiáng)度裝置
- 高強(qiáng)度殼體和高強(qiáng)度殼體板材及強(qiáng)度增強(qiáng)方法
- 高強(qiáng)度鋼筋等強(qiáng)度壓接機(jī)





