[發(fā)明專利]一種基于長尾關(guān)鍵詞的搜索推薦方法及裝置在審
| 申請(qǐng)?zhí)枺?/td> | 201410281334.0 | 申請(qǐng)日: | 2014-06-20 |
| 公開(公告)號(hào): | CN104021214A | 公開(公告)日: | 2014-09-03 |
| 發(fā)明(設(shè)計(jì))人: | 崔代超 | 申請(qǐng)(專利權(quán))人: | 北京奇虎科技有限公司;奇智軟件(北京)有限公司 |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30 |
| 代理公司: | 北京華沛德權(quán)律師事務(wù)所 11302 | 代理人: | 劉杰 |
| 地址: | 100088 北京市西城區(qū)新*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 長尾 關(guān)鍵詞 搜索 推薦 方法 裝置 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及索引,具體涉及一種基于長尾關(guān)鍵詞的搜索推薦方法及裝置。
背景技術(shù)
搜索引擎是當(dāng)前互聯(lián)網(wǎng)領(lǐng)域中的一項(xiàng)極其重要的應(yīng)用,而基于分詞索引的檢索技術(shù)是目前主流搜索引擎的基本支柱。目前,搜索引擎主要是根據(jù)網(wǎng)頁和搜索查詢?cè)~的匹配程度給出匹配度最高的網(wǎng)頁。但是,通過對(duì)海量用戶的查詢?cè)~統(tǒng)計(jì)分析,發(fā)現(xiàn)用戶經(jīng)常通過長尾關(guān)鍵詞作為搜索查詢?cè)~進(jìn)行索引查詢,但是現(xiàn)有技術(shù)中搜索引擎往往只是對(duì)長尾關(guān)鍵詞做一般的分詞處理做索引,但分詞處理后在搜索數(shù)據(jù)庫中都沒有索引到與查詢的長尾關(guān)鍵詞匹配度很高的網(wǎng)頁,同時(shí)用戶輸入的長尾關(guān)鍵詞本身通常包含很明確的搜索需求,因此這時(shí)搜索引擎給出的搜索結(jié)果無法較好的滿足用戶的搜索需求;進(jìn)一步地,用戶可能需要花費(fèi)更多的時(shí)間和精力在搜索結(jié)果網(wǎng)頁中查找,亦或是重新調(diào)整查詢?cè)~再次檢索,導(dǎo)致搜索效率低下。
發(fā)明內(nèi)容
鑒于上述問題,提出了本發(fā)明以便提供一種克服上述問題或者至少部分地解決上述問題的。
本發(fā)明提供的基于長尾關(guān)鍵詞的搜索推薦方法,包括:
接收用戶搜索查詢?cè)~,判斷所述查詢?cè)~的類型是否為長尾關(guān)鍵詞;
當(dāng)所述查詢?cè)~的類型為長尾關(guān)鍵詞時(shí),查找與其相匹配的有互動(dòng)性質(zhì)的網(wǎng)站作為可解決長尾關(guān)鍵詞問題的網(wǎng)站優(yōu)先向用戶推薦。
所述判斷所述查詢?cè)~的類型是否為長尾關(guān)鍵詞包括:對(duì)所述查詢?cè)~進(jìn)行分詞處理,在判斷出所述查詢?cè)~由至少2個(gè)單詞組成,且所述查詢?cè)~在一段時(shí)間閾值內(nèi)的搜索次數(shù)低于設(shè)定次數(shù)閾值的情況下,確定所述查詢?cè)~為長尾關(guān)鍵詞;
或者,如果搜索查詢?cè)~索引的通用搜索結(jié)果匹配程度低于匹配閾值,則確定所述查詢?cè)~為長尾關(guān)鍵詞。
所述查找與其相匹配的有互動(dòng)性質(zhì)的網(wǎng)站作為可解決長尾關(guān)鍵詞問題的網(wǎng)站優(yōu)先向用戶推薦,包括:根據(jù)分詞后各個(gè)分詞的搜索熱度判斷所述各個(gè)分詞的權(quán)重,將權(quán)重最高的分詞作為核心分詞,其他分詞作為支持詞;查找與所述核心分詞相匹配的有互動(dòng)性質(zhì)的網(wǎng)站作為可解決所述長尾關(guān)鍵詞問題的網(wǎng)站優(yōu)先向用戶推薦。
所述查找與所述核心分詞相匹配的有互動(dòng)性質(zhì)的網(wǎng)站作為可解決所述長尾關(guān)鍵詞問題的網(wǎng)站優(yōu)先向用戶推薦,包括:在綜合性問答知識(shí)類網(wǎng)站、垂直領(lǐng)域的網(wǎng)站和綜合性經(jīng)驗(yàn)分享類網(wǎng)站中,分別查找與所述核心分詞相匹配的有互動(dòng)性質(zhì)的網(wǎng)站,并將查找到的網(wǎng)站作為可解決所述長尾關(guān)鍵詞問題的網(wǎng)站優(yōu)先向用戶推薦。
所述相匹配包括下述中的至少一個(gè):
所述關(guān)鍵詞在所述有互動(dòng)性質(zhì)的網(wǎng)站和/或所述有互動(dòng)性質(zhì)的網(wǎng)站的網(wǎng)頁中出現(xiàn)的次數(shù)等于或者大于設(shè)定次數(shù)閾值;
包含有解決過有關(guān)關(guān)鍵詞和/或其同義詞、相關(guān)詞問題的網(wǎng)頁的所述有互動(dòng)性質(zhì)的網(wǎng)站的搜索熱度等于或者大于設(shè)定搜索熱度閾值;
解決過有關(guān)關(guān)鍵詞和/或其同義詞、相關(guān)詞問題的所述有互動(dòng)性質(zhì)的網(wǎng)站的網(wǎng)頁的搜索熱度等于或者大于設(shè)定搜索熱度閾值;
單個(gè)有互動(dòng)性質(zhì)的網(wǎng)站中的解決過有關(guān)關(guān)鍵詞和/或其同義詞、相關(guān)詞問題的網(wǎng)頁的個(gè)數(shù)等于或者大于設(shè)定個(gè)數(shù)閾值。
所述有互動(dòng)性質(zhì)的網(wǎng)站,包括:社交網(wǎng)站、互動(dòng)社區(qū)、論壇、攻略/經(jīng)驗(yàn)分享網(wǎng)站或貼吧。
本發(fā)明提供的基于長尾關(guān)鍵詞的搜索推薦方法,包括:
接收用戶輸入的搜索查詢?cè)~,
當(dāng)所述查詢?cè)~為長尾關(guān)鍵詞時(shí),推薦與其相關(guān)的互動(dòng)性質(zhì)的網(wǎng)站。
本發(fā)明提供的基于長尾關(guān)鍵詞的搜索推薦裝置,包括:
判斷模塊,用于接收用戶搜索查詢?cè)~,判斷所述查詢?cè)~的類型是否為長尾關(guān)鍵詞;
網(wǎng)站推薦模塊,用于當(dāng)所述判斷模塊的判斷結(jié)果為是時(shí),查找與其相匹配的有互動(dòng)性質(zhì)的網(wǎng)站作為可解決長尾關(guān)鍵詞問題的網(wǎng)站優(yōu)先向用戶推薦。
所述判斷模塊,包括:
分詞單元,用于接收用戶搜索查詢?cè)~,對(duì)所述查詢?cè)~進(jìn)行分詞處理;
第一判斷執(zhí)行單元,用于判斷所述查詢?cè)~是否由至少2個(gè)單詞組成,且所述查詢?cè)~是否在一段時(shí)間閾值內(nèi)的搜索次數(shù)低于設(shè)定次數(shù)閾值;若是,確定所述查詢?cè)~為長尾關(guān)鍵詞;
或,所述判斷模塊,包括:
分詞單元,用于接收用戶搜索查詢?cè)~,對(duì)所述查詢?cè)~進(jìn)行分詞處理;
第二判斷執(zhí)行單元,用于判斷根據(jù)搜索查詢?cè)~索引的通用搜索結(jié)果匹配程度是否低于匹配閾值;若是,確定所述查詢?cè)~為長尾關(guān)鍵詞。
所述網(wǎng)站推薦模塊,包括:
判斷分析單元,用于當(dāng)所述判斷執(zhí)行單元的判斷結(jié)果為是時(shí),根據(jù)分詞后各個(gè)分詞的搜索熱度判斷所述各個(gè)分詞的權(quán)重,將權(quán)重最高的分詞作為核心分詞,其他分詞作為支持詞;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京奇虎科技有限公司;奇智軟件(北京)有限公司,未經(jīng)北京奇虎科技有限公司;奇智軟件(北京)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410281334.0/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 關(guān)鍵詞輸出設(shè)備和關(guān)鍵詞輸出方法
- 用于選擇用于網(wǎng)絡(luò)發(fā)布的關(guān)鍵詞的方法和設(shè)備
- 關(guān)鍵詞質(zhì)量度的檢測方法和裝置
- 關(guān)鍵詞排名的檢測方法和裝置
- 關(guān)鍵詞相似度獲取方法、裝置及服務(wù)器
- 關(guān)鍵詞推薦方法及裝置
- 一種關(guān)鍵詞檢索管理系統(tǒng)
- 一種信息推薦方法、電子設(shè)備、存儲(chǔ)介質(zhì)及系統(tǒng)
- 關(guān)鍵詞廣告投放自動(dòng)化否定關(guān)鍵詞方法及裝置
- 一種長尾關(guān)鍵詞識(shí)別方法、關(guān)鍵詞搜索方法及計(jì)算機(jī)設(shè)備





