[發(fā)明專利]一種垂直搜索的查詢方法、系統(tǒng)和裝置有效
| 申請(qǐng)?zhí)枺?/td> | 200910210422.0 | 申請(qǐng)日: | 2009-11-02 |
| 公開(公告)號(hào): | CN102053983A | 公開(公告)日: | 2011-05-11 |
| 發(fā)明(設(shè)計(jì))人: | 何杰 | 申請(qǐng)(專利權(quán))人: | 阿里巴巴集團(tuán)控股有限公司 |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30 |
| 代理公司: | 北京鑫媛睿博知識(shí)產(chǎn)權(quán)代理有限公司 11297 | 代理人: | 龔家驊 |
| 地址: | 英屬開曼群島大開*** | 國(guó)省代碼: | 開曼群島;KY |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 垂直 搜索 查詢 方法 系統(tǒng) 裝置 | ||
技術(shù)領(lǐng)域
本申請(qǐng)涉及網(wǎng)絡(luò)技術(shù)領(lǐng)域,特別是涉及一種垂直搜索的查詢方法、系統(tǒng)和裝置。
背景技術(shù)
隨著互聯(lián)網(wǎng)的日益發(fā)展,互聯(lián)網(wǎng)上存儲(chǔ)的信息量日趨龐大。當(dāng)人們需要獲取某方面的專用信息時(shí),通過搜索引擎進(jìn)行搜索。但由于互聯(lián)網(wǎng)上的信息量過大,采用通用搜索方式獲取的搜索結(jié)果缺乏準(zhǔn)確性,于是垂直搜索方式得到了快速的發(fā)展。垂直搜索是針對(duì)某一個(gè)行業(yè)的專業(yè)搜索引擎,是搜索引擎的細(xì)分和延伸,是對(duì)網(wǎng)頁(yè)庫(kù)中的某類專門的信息進(jìn)行一次整合,定向分字段抽取出需要的數(shù)據(jù)進(jìn)行處理后再以某種形式返回給用戶。相對(duì)通用搜索引擎的信息量大、查詢不準(zhǔn)確、深度不夠等提出來的新的搜索引擎服務(wù)模式,通過針對(duì)某一特定領(lǐng)域、某一特定人群或某一特定需求提供的有一定價(jià)值的信息和相關(guān)服務(wù)。其特點(diǎn)就是“專、精、深”,且具有行業(yè)色彩,相比較通用搜索引擎的海量信息無序化,垂直搜索引擎則顯得更加專注、具體和深入。
垂直搜索引擎的應(yīng)用方向很多,比如企業(yè)庫(kù)搜索、供求信息搜索引擎、購(gòu)物搜索、房產(chǎn)搜索、人才搜索、地圖搜索、mp3搜索、圖片搜索等,幾乎各行各業(yè)各類信息都可以進(jìn)一步細(xì)化成各類的垂直搜索引擎。
當(dāng)垂直搜索用于購(gòu)物搜索時(shí),用戶在B2C(Business?to?Customer,企業(yè)對(duì)消費(fèi)者購(gòu)物模式)或C2C(Consumer?to?Customer,消費(fèi)者對(duì)消費(fèi)者購(gòu)物模式)購(gòu)物網(wǎng)站輸入查詢?cè)~購(gòu)物,通常會(huì)返回兩部分的結(jié)果:1.商品分類的導(dǎo)航信息,2.與查詢相關(guān)的搜索結(jié)果。導(dǎo)航的商品分類名稱依據(jù)樹的結(jié)構(gòu)組織起來,方便用戶沿樹結(jié)構(gòu)的路徑自上而下通過商品分類的信息的定位到更準(zhǔn)確的搜索結(jié)果。
商品類目樹結(jié)構(gòu)保存在數(shù)據(jù)庫(kù)相對(duì)應(yīng)的數(shù)據(jù)表,數(shù)據(jù)的輸入與維護(hù)需要人工進(jìn)行,在B2C或C2C網(wǎng)站中每一個(gè)商品的展示都必須屬于該商品類目樹的某一個(gè)節(jié)點(diǎn)或多個(gè)節(jié)點(diǎn)。
當(dāng)前的電子商務(wù)網(wǎng)站往往商品數(shù)量過于龐大,導(dǎo)致商品分類過多。在上億規(guī)模的商品數(shù)量上,商品類目樹通常會(huì)接近一萬(wàn)個(gè)節(jié)點(diǎn),每一層級(jí)的類目節(jié)點(diǎn)數(shù)量往往會(huì)多達(dá)幾十個(gè)。在用戶查詢時(shí),顯示給用戶的商品分類信息過多,并且無法告訴用戶這些商品類目哪些對(duì)用戶的查詢更重要。對(duì)該問題,目前主流的解決方式是當(dāng)用戶查詢時(shí),逐個(gè)統(tǒng)計(jì)每個(gè)類目下的返回結(jié)果數(shù)量。然后把這些商品類目依據(jù)商品數(shù)量按照從大到小進(jìn)行排序,并且設(shè)置一定的閥值。把商品數(shù)低于這個(gè)閥值的類目隱藏起來。達(dá)到減少分類數(shù)量的目的。
在實(shí)現(xiàn)本申請(qǐng)的過程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)至少存在如下問題:
(1)顯示的類目與用戶的查詢相關(guān)性很低。
(2)商品分類之間沒有機(jī)制決定哪個(gè)商品類目更重要。
(3)對(duì)于商品的類目顯示的數(shù)量?jī)H僅用閥值控制會(huì)把相關(guān)性高的類目隱藏起來。
發(fā)明內(nèi)容
本申請(qǐng)實(shí)施例提供一種垂直搜索的查詢方法、系統(tǒng)和裝置,用于提高查詢結(jié)果與用戶查詢的相關(guān)性。
本申請(qǐng)實(shí)施例提供一種垂直搜索的查詢方法,應(yīng)用于包括查詢服務(wù)器、分析服務(wù)器和日志服務(wù)器的系統(tǒng)中,其特征在于,包括:
查詢服務(wù)器獲取用戶的查詢信息;
所述查詢服務(wù)器根據(jù)所述查詢信息在所述商品類目服務(wù)器的查詢字典中獲取查詢結(jié)果,所述查詢結(jié)果為與所述查詢信息相匹配的商品類目下的子商品類目及其對(duì)應(yīng)的權(quán)重;
所述查詢服務(wù)器將所述查詢結(jié)果中的子商品類目按照其對(duì)應(yīng)的權(quán)重進(jìn)行排序,并將排序結(jié)果發(fā)送給所述用戶,使所述用戶進(jìn)行查看,并使日志服務(wù)器根據(jù)所述用戶查看的商品類目和所述查詢信息生成日志,并將所述日志發(fā)送給分析服務(wù)器進(jìn)行統(tǒng)計(jì)分析獲得統(tǒng)計(jì)分析結(jié)果,所述統(tǒng)計(jì)分析結(jié)果用于更新所述商品類目服務(wù)器的查詢字典,用于后續(xù)的查詢。
其中,在所述查詢服務(wù)器將所述查詢結(jié)果中的子商品類目按照其對(duì)應(yīng)的權(quán)重進(jìn)行排序之前,還包括:設(shè)定一權(quán)重閾值,將所述查詢結(jié)果中的權(quán)重大于所述權(quán)重閾值的子商品類目按照其對(duì)應(yīng)的權(quán)重進(jìn)行排序。
其中,所述查詢服務(wù)器獲取用戶的查詢信息之前,還包括:
前端服務(wù)器獲取用戶的查詢信息,所述查詢信息包括所述用戶的查詢?cè)~和商品類目;
所述前端服務(wù)器對(duì)所述查詢?cè)~進(jìn)行歸一化處理和獲取商品類目對(duì)應(yīng)的商品ID;
所述前端服務(wù)器將經(jīng)歸一化處理的所述查詢?cè)~和所述商品類目ID轉(zhuǎn)發(fā)給所述商品類目服務(wù)器。
其中,其特征在于,
所述日志服務(wù)器根據(jù)所述用戶查看的商品類目和所述查詢信息生成日志之前,還包括:
獲取前端服務(wù)器轉(zhuǎn)發(fā)的所述用戶的查詢信息;
分析服務(wù)器進(jìn)行統(tǒng)計(jì)分析獲得統(tǒng)計(jì)分析結(jié)果,所述統(tǒng)計(jì)分析結(jié)果用于更新所述商品類目服務(wù)器的查詢字典,用于后續(xù)的查詢具體包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于阿里巴巴集團(tuán)控股有限公司,未經(jīng)阿里巴巴集團(tuán)控股有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910210422.0/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種用艾根、狐貍尾根制備香雞的方法
- 下一篇:一種醬肉的制作方法
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 帶有前處理和后處理的數(shù)據(jù)庫(kù)復(fù)合查詢系統(tǒng)及方法
- 數(shù)據(jù)庫(kù)查詢的方法和系統(tǒng)
- 查詢系統(tǒng)、查詢終端以及查詢方法
- 交易信息查詢方法、查詢裝置及查詢系統(tǒng)
- 數(shù)據(jù)查詢與結(jié)果生成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 在RDF數(shù)據(jù)集上進(jìn)行OPTIONAL查詢的方法及存儲(chǔ)介質(zhì)
- 一種多表關(guān)聯(lián)查詢方法、裝置及設(shè)備
- 一種基于Impala的查詢方法和裝置
- 從查詢生成子查詢
- 一種基于通用查詢語(yǔ)言的查詢方法及查詢系統(tǒng)
- 一種數(shù)據(jù)庫(kù)讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





