[發(fā)明專利]一種搜索方法和系統(tǒng)有效
| 申請?zhí)枺?/td> | 201210018149.3 | 申請日: | 2012-01-19 |
| 公開(公告)號: | CN103218364A | 公開(公告)日: | 2013-07-24 |
| 發(fā)明(設(shè)計)人: | 李嘉森 | 申請(專利權(quán))人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京潤澤恒知識產(chǎn)權(quán)代理有限公司 11319 | 代理人: | 蘇培華 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 開曼群島;KY |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 搜索 方法 系統(tǒng) | ||
1.一種搜索方法,其特征在于,包括:
對于用戶輸入的搜索詞,獲取所述搜索詞對應的各查詢詞;
針對得到的各查詢詞,在索引中搜索與各查詢詞相應的各索引詞,所述索引根據(jù)目標對象的字段構(gòu)建,所述目標對象的字段包括通過第一分隔符將目標對象的標題信息字段區(qū)和屬性信息字段區(qū)拼接成的新字段;
依據(jù)各索引詞在所屬新字段中的位置和所述新字段中第一分隔符的位置,確認索引詞對應的查詢詞在所屬新字段中是屬于標題信息字段區(qū)還是屬于屬性信息字段區(qū);
根據(jù)所述新字段的各查詢詞所在所屬字段區(qū)計算搜索詞與該新字段的總相關(guān)度;所述總相關(guān)度包括依據(jù)所述新字段的各查詢詞所在所屬字段區(qū)的權(quán)重計算的第一相關(guān)度;
基于各新字段與搜索詞的總相關(guān)度,返回至少一個新字段對應的目標對象。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述通過第一分隔符將目標對象的標題信息字段區(qū)和屬性信息字段區(qū)拼接成的新字段,包括以下步驟:
讀取目標對象的標題信息字段區(qū)和屬性信息字段區(qū);
用空白字符替換所述新字段中與第一分隔符相同的字符;
將替換后的標題信息字段區(qū)和屬性信息字段區(qū)通過第一分隔符拼接為一個新字段。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,根據(jù)所述字段中的各分詞構(gòu)建索引通過以下步驟進行:
將各目標對象的標識通過第二分隔符與相應的新字段進行對應;
對各新字段進行分詞操作;
以分詞操作得到的分詞作為索引詞,將索引詞與相關(guān)各目標對象的標識和該索引詞在各新字段中位置進行對應。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,通過以下步驟確認所述查詢詞是屬于標題信息字段區(qū)或者是屬于屬性信息字段區(qū):
根據(jù)所述索引詞與相關(guān)各目標對象的標識的對應關(guān)系,查詢與標識相應的新字段;
將所述索引詞在所述新字段中的位置與第一分隔符在所述新字段中的位置進行比較,確認所述索引詞對應的查詢詞是屬于標題信息字段區(qū)或者是屬于屬性信息字段區(qū)。
5.根據(jù)權(quán)利要求1其中之一所述的方法,其特征在于,通過以下步驟獲得所述第一相關(guān)度:
將各查詢詞字符串長度除以所在字段區(qū)字符串長度,獲得各查詢詞與所在字段區(qū)的區(qū)間相關(guān)度;
將各相關(guān)度乘以所在字段區(qū)的權(quán)重并相加,得到搜索詞與新字段的第一相關(guān)度。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述的搜索詞包括:
將用戶的輸入的關(guān)鍵詞作為搜索詞;
或者,將用戶選擇的根據(jù)該用戶的輸入詞返回的建議詞中的一個作為搜索詞;其中,所述的建議詞通過預先統(tǒng)計的用戶輸入的輸入詞與對應結(jié)果的點擊關(guān)系提取獲得。
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,對于用戶輸入的搜索詞,獲取所述搜索詞的查詢詞時包括:
通過智能糾錯引擎對于用戶錯誤輸入的搜索詞進行糾錯。
8.根據(jù)權(quán)利要求1所述的方法,其特征在于:
所述的目標對象包括商品;所述的屬性信息包括商品的品牌信息。
9.根據(jù)權(quán)利要求1所述的方法,其特征在于,基于各新字段與搜索詞的總相關(guān)度,至少輸出一個新字段至用戶端時:
至少輸出一個排序靠前的目標對象;所述目標對象基于相應新字段與搜索詞的總相關(guān)度進行排序。
10.一種搜索裝置,其特征在于,包括:
查詢詞獲取模塊,對于用戶輸入的搜索詞,獲取所述搜索詞對應的各查詢詞;
索引詞搜索模塊,用于針對得到的各查詢詞,在索引中搜索與各查詢詞相應的各索引詞,所述索引根據(jù)目標對象的字段構(gòu)建,所述目標對象的字段包括通過第一分隔符將目標對象的標題信息字段區(qū)和屬性信息字段區(qū)拼接成的新字段;
位置確認模塊,用于依據(jù)各索引詞在所屬新字段中的位置和所述新字段中第一分隔符的位置,確認索引詞對應的查詢詞在所屬新字段中是屬于標題信息字段區(qū)還是屬于屬性信息字段區(qū);
相關(guān)度計算模塊,用于根據(jù)所述新字段的各查詢詞所在所屬字段區(qū)計算搜索詞與該新字段的總相關(guān)度;所述總相關(guān)度包括依據(jù)所述新字段的各查詢詞所在所屬字段區(qū)的權(quán)重計算的第一相關(guān)度;
輸出模塊,用于基于各新字段與搜索詞的總相關(guān)度,返回至少一個新字段對應的目標對象。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于阿里巴巴集團控股有限公司,未經(jīng)阿里巴巴集團控股有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210018149.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





