[發(fā)明專利]一種搜索方法及系統(tǒng)有效
| 申請?zhí)枺?/td> | 201210164223.2 | 申請日: | 2012-05-24 |
| 公開(公告)號: | CN103425697B | 公開(公告)日: | 2017-09-26 |
| 發(fā)明(設(shè)計)人: | 陸平;吉鋒;胡磊;劉麗霞;程龔;瞿裕忠 | 申請(專利權(quán))人: | 中興通訊股份有限公司;南京大學(xué) |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京安信方達(dá)知識產(chǎn)權(quán)代理有限公司11262 | 代理人: | 李健,龍洪 |
| 地址: | 518057 廣東省深圳市南山*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 搜索 方法 系統(tǒng) | ||
1.一種搜索方法,包括:
接收到查詢的關(guān)鍵詞集合后,根據(jù)預(yù)存的所有數(shù)據(jù)項(xiàng)分別計算每個關(guān)鍵詞映射到每個數(shù)據(jù)字段的條件概率;
根據(jù)所述關(guān)鍵詞集合和所述所有的數(shù)據(jù)項(xiàng)查找出所有可行的查詢轉(zhuǎn)換;
根據(jù)包括每條所述可行的查詢轉(zhuǎn)換中的所有關(guān)鍵詞映射到對應(yīng)數(shù)據(jù)字段的條件概率的預(yù)定規(guī)則,對所述可行的查詢轉(zhuǎn)換進(jìn)行排序;
按照排序后的查詢轉(zhuǎn)換搜索對應(yīng)的數(shù)據(jù)項(xiàng);
其中,所述根據(jù)包括每條所述可行的查詢轉(zhuǎn)換中的所有關(guān)鍵詞映射到對應(yīng)數(shù)據(jù)字段的條件概率的預(yù)定規(guī)則,對所述可行的查詢轉(zhuǎn)換進(jìn)行排序,包括:
統(tǒng)計用戶做出的所有歷史選擇中的所述每個關(guān)鍵詞映射到所有數(shù)據(jù)字段的次數(shù);
計算每個關(guān)鍵詞被歷史選中的映射到每條所述查詢轉(zhuǎn)換中對應(yīng)的數(shù)據(jù)字段的次數(shù),與該關(guān)鍵詞被歷史選中的映射到所有數(shù)據(jù)字段的次數(shù)的總和的比例;
對于每條所述查詢轉(zhuǎn)換,將所有關(guān)鍵詞映射到對應(yīng)數(shù)據(jù)字段的條件概率與每個關(guān)鍵詞對應(yīng)的所述比例乘于一權(quán)重系數(shù)的積進(jìn)行求和;
按照求出的和的大小順序?qū)?yīng)的查詢轉(zhuǎn)換進(jìn)行排序。
2.如權(quán)利要求1所述的方法,其特征在于:所述根據(jù)包括每條所述可行的查詢轉(zhuǎn)換中的所有關(guān)鍵詞映射到對應(yīng)數(shù)據(jù)字段的條件概率的預(yù)定規(guī)則,對所述可行的查詢轉(zhuǎn)換進(jìn)行排序,包括:
對于每條所述可行的查詢轉(zhuǎn)換,對所有關(guān)鍵詞映射到對應(yīng)數(shù)據(jù)字段的條件概率進(jìn)行求和;
按照求出的和的大小順序?qū)?yīng)的查詢轉(zhuǎn)換進(jìn)行排序。
3.如權(quán)利要求1所述的方法,其特征在于:
所述權(quán)重系數(shù)α為lg(M+1),其中,M是歷史上用戶做出選擇的總次數(shù)。
4.如權(quán)利要求2-3任一項(xiàng)所述的方法,其特征在于:所述按照求出的和的大小順序?qū)?yīng)的查詢轉(zhuǎn)換進(jìn)行排序之后,還包括:
步驟1、從所述排序中取出排序第一的查詢轉(zhuǎn)換,放入一重排序列;
步驟2、分別計算所述排序中剩余的每個查詢轉(zhuǎn)換與所述重排序列中的每個查詢轉(zhuǎn)換的相似度;
步驟3、若所述重排序列中僅有一個查詢轉(zhuǎn)換,則從所述排序中取出相似度最小的查詢轉(zhuǎn)換,若相似度最小的查詢轉(zhuǎn)換有多個則取在所述排序中排在最前面的查詢轉(zhuǎn)換;若所述重排序列中有多個查詢轉(zhuǎn)換,則取趨同度最小的查詢轉(zhuǎn)換,若趨同度最小的查詢轉(zhuǎn)換有多個,則取在所述排序中排在最前面的查詢轉(zhuǎn)換,所述趨同度為所述排序中的查詢轉(zhuǎn)換與所述重排序列中的所有查詢轉(zhuǎn)換的相似度的最大值;
步驟4、將取出的查詢轉(zhuǎn)換放入所述重排序列中,排在所述重排序列中的查詢轉(zhuǎn)換之后,并從所述排序中刪除所述取出的查詢轉(zhuǎn)換;
重復(fù)執(zhí)行步驟2-4,直到所述排序中的查詢轉(zhuǎn)換都被刪除;
所述按照排序后的查詢轉(zhuǎn)換搜索對應(yīng)的數(shù)據(jù)項(xiàng)為,按照所述重排序列中排序的查詢轉(zhuǎn)換搜索對應(yīng)的數(shù)據(jù)項(xiàng)。
5.如權(quán)利要求1-3任一項(xiàng)所述的方法,其特征在于:所述按照排序后的查詢轉(zhuǎn)換搜索對應(yīng)的數(shù)據(jù)項(xiàng)之后,還包括:
若接收到用戶選擇一個或多個所述數(shù)據(jù)項(xiàng),則根據(jù)用戶選擇的數(shù)據(jù)項(xiàng),記錄每個關(guān)鍵詞映射到對應(yīng)數(shù)據(jù)字段的次數(shù)。
6.一種搜索系統(tǒng),包括:
第一模塊,用于接收到查詢的關(guān)鍵詞集合后,根據(jù)預(yù)存的所有數(shù)據(jù)項(xiàng)分別計算每個關(guān)鍵詞映射到每個數(shù)據(jù)字段的條件概率;
第二模塊,用于根據(jù)所述關(guān)鍵詞集合和所述所有的數(shù)據(jù)項(xiàng)查找出所有可行的查詢轉(zhuǎn)換;
第三模塊,用于根據(jù)包括每條所述可行的查詢轉(zhuǎn)換中的所有關(guān)鍵詞映射到對應(yīng)數(shù)據(jù)字段的條件概率的預(yù)定規(guī)則,對所述可行的查詢轉(zhuǎn)換進(jìn)行排序;
第四模塊,用于按照排序后的查詢轉(zhuǎn)換搜索對應(yīng)的數(shù)據(jù)項(xiàng);
其中,所述第三模塊包括,
第三單元,用于統(tǒng)計用戶做出的所有歷史選擇中的所述每個關(guān)鍵詞映射到所有數(shù)據(jù)字段的次數(shù);
第四單元,用于計算每個關(guān)鍵詞被歷史選中的映射到每條所述查詢轉(zhuǎn)換中對應(yīng)的數(shù)據(jù)字段的次數(shù),與該關(guān)鍵詞被歷史選中的映射到所有數(shù)據(jù)字段的次數(shù)的總和的比例;
第五單元,用于對于每條所述查詢轉(zhuǎn)換,將所有關(guān)鍵詞映射到對應(yīng)數(shù)據(jù)字段的條件概率與每個關(guān)鍵詞對應(yīng)的所述比例乘于一權(quán)重系數(shù)的積進(jìn)行求和;
第六單元,用于按照求出的和的大小順序?qū)?yīng)的查詢轉(zhuǎn)換進(jìn)行排序。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中興通訊股份有限公司;南京大學(xué),未經(jīng)中興通訊股份有限公司;南京大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210164223.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





