[發(fā)明專利]一種基于用戶行為的搜索方法及系統(tǒng)有效
| 申請?zhí)枺?/td> | 201310068715.6 | 申請日: | 2013-03-05 |
| 公開(公告)號: | CN104035927B | 公開(公告)日: | 2020-03-03 |
| 發(fā)明(設(shè)計(jì))人: | 閆澤華 | 申請(專利權(quán))人: | 百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/955 |
| 代理公司: | 北京鴻德海業(yè)知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11412 | 代理人: | 袁媛 |
| 地址: | 100085 北京*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 用戶 行為 搜索 方法 系統(tǒng) | ||
本發(fā)明提供了一種基于用戶行為的搜索方法及系統(tǒng),該方法包括:基礎(chǔ)搜索服務(wù)器依據(jù)用戶在搜索引擎中輸入的搜索詞生成搜索結(jié)果頁;排序服務(wù)器依據(jù)所述搜索詞在預(yù)先生成的映射關(guān)系中獲取對應(yīng)的標(biāo)簽,利用與所述搜索結(jié)果頁相似度最高的標(biāo)簽標(biāo)注所述搜索結(jié)果頁,并將具有相同標(biāo)簽的搜索結(jié)果頁劃分為一類;排序服務(wù)器依據(jù)預(yù)設(shè)的興趣類別與網(wǎng)頁的對應(yīng)關(guān)系獲得搜索結(jié)果頁對應(yīng)標(biāo)簽的興趣類別,將預(yù)先生成的用戶的興趣類別與標(biāo)簽的興趣類別進(jìn)行匹配,增加匹配到的標(biāo)簽所對應(yīng)的搜索結(jié)果頁的權(quán)重值,將依據(jù)權(quán)重值進(jìn)行排序后得到的搜索結(jié)果頁推送給用戶。根據(jù)本發(fā)明提供的技術(shù)方案,能夠向用戶提供有針對性和個性化的搜索結(jié)果,提高搜索效率。
【技術(shù)領(lǐng)域】
本發(fā)明涉及互聯(lián)網(wǎng)領(lǐng)域的搜索技術(shù),尤其涉及一種基于用戶行為的搜索方法及系統(tǒng)。
【背景技術(shù)】
目前,搜索引擎都是依據(jù)用戶在搜索引擎中的點(diǎn)擊行為和相關(guān)搜索詞對搜索結(jié)果的順序進(jìn)行調(diào)整,例如,在前十個搜索結(jié)果中,如果用戶點(diǎn)擊第五個搜索結(jié)果的數(shù)量遠(yuǎn)遠(yuǎn)超過前四個搜索結(jié)果,表示第五個搜索結(jié)果與前四個搜索結(jié)果相比,與搜索詞更加匹配;或者,用戶連續(xù)輸入“蘋果”和“蘋果手機(jī)”兩個搜索詞,表示用戶的真實(shí)需求是搜索“蘋果手機(jī)”,而第一個搜索詞的搜索結(jié)果并沒有給出用戶滿意的搜索結(jié)果,因此,搜索引擎通過這樣的方式獲得用戶行為反饋,對搜索結(jié)果進(jìn)行調(diào)整。
但是,在搜索引擎對搜索結(jié)果進(jìn)行調(diào)整時獲取的用戶的信息量較少,而且有效性較低,例如,搜索引擎只能獲得用戶是否打開某個搜索結(jié)果的信息,而不知道用戶對該搜索結(jié)果的滿意程度;而且,搜索引擎是對大規(guī)模用戶數(shù)據(jù)進(jìn)行分析,進(jìn)而調(diào)整搜索結(jié)果,因此是對通用搜索需求的搜索結(jié)果進(jìn)行調(diào)整,不能有效區(qū)分統(tǒng)一搜索詞的不同語義信息,不能根據(jù)用戶的興趣愛好進(jìn)行傾向性的調(diào)整,因此沒有實(shí)現(xiàn)向用戶提供更具有針對性和個性化的搜索結(jié)果,搜索引擎的個性化服務(wù)水平較低,用戶需要在搜索結(jié)果中篩選感興趣的搜索結(jié)果,增加搜索引擎的負(fù)擔(dān),搜索效率較低;例如,對于具有不同語義的搜索詞“蘋果”,該搜索詞包含兩個語義信息:水果和手機(jī),大規(guī)模用戶數(shù)量的調(diào)整將導(dǎo)致一個需求較大的語義信息覆蓋另一個語義信息。
【發(fā)明內(nèi)容】
本發(fā)明提供了一種基于用戶行為的搜索方法及系統(tǒng),能夠向用戶提供有針對性和個性化的搜索結(jié)果,提高搜索效率。
本發(fā)明的具體技術(shù)方案如下:
根據(jù)本發(fā)明一優(yōu)選實(shí)施例,一種基于用戶行為的搜索方法,包括:
基礎(chǔ)搜索服務(wù)器依據(jù)用戶在搜索引擎中輸入的搜索詞生成搜索結(jié)果頁;
排序服務(wù)器依據(jù)所述搜索詞在預(yù)先生成的映射關(guān)系中獲取對應(yīng)的標(biāo)簽,利用與所述搜索結(jié)果頁相似度最高的標(biāo)簽標(biāo)注所述搜索結(jié)果頁,并將具有相同標(biāo)簽的搜索結(jié)果頁劃分為一類;
排序服務(wù)器依據(jù)預(yù)設(shè)的興趣類別與網(wǎng)頁的對應(yīng)關(guān)系獲得搜索結(jié)果頁對應(yīng)標(biāo)簽的興趣類別,將預(yù)先生成的用戶的興趣類別與標(biāo)簽的興趣類別進(jìn)行匹配,增加匹配到的標(biāo)簽所對應(yīng)的搜索結(jié)果頁的權(quán)重值,將依據(jù)權(quán)重值進(jìn)行排序后得到的搜索結(jié)果頁推送給用戶。
上述方法中,生成映射關(guān)系的方法為:
網(wǎng)頁服務(wù)器從搜索結(jié)果頁的正文提取高頻詞并生成高頻詞集合,將搜索結(jié)果頁與高頻詞集合的映射關(guān)系保存到網(wǎng)頁數(shù)據(jù)庫;
當(dāng)用戶輸入搜索詞后收藏搜索結(jié)果頁并標(biāo)注標(biāo)簽時,搜索信息挖掘服務(wù)器依據(jù)搜索結(jié)果頁與高頻詞集合的映射關(guān)系生成搜索詞、高頻詞集合和標(biāo)簽的映射關(guān)系,并將搜索詞、高頻詞集合和標(biāo)簽的映射關(guān)系保存到映射信息數(shù)據(jù)庫。
上述方法中,所述從搜索結(jié)果頁的正文提取高頻詞具體包括:
從搜索結(jié)果頁中提取候選正文,并將候選正文中鏈接文本數(shù)目與總文本數(shù)目的比值大于預(yù)設(shè)閾值的文本刪除,得到搜索結(jié)果頁的正文;
對所述正文進(jìn)行分詞處理,得到一個以上單詞;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司,未經(jīng)百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310068715.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





