[發(fā)明專利]通過替換概念性詞語進(jìn)行搜索推薦的系統(tǒng)有效
| 申請?zhí)枺?/td> | 201310501114.X | 申請日: | 2013-10-22 |
| 公開(公告)號(hào): | CN103593410B | 公開(公告)日: | 2017-04-12 |
| 發(fā)明(設(shè)計(jì))人: | 朱其立;孫偉 | 申請(專利權(quán))人: | 上海交通大學(xué) |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30 |
| 代理公司: | 上海漢聲知識(shí)產(chǎn)權(quán)代理有限公司31236 | 代理人: | 郭國中 |
| 地址: | 200240 *** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 通過 替換 概念性 詞語 進(jìn)行 搜索 推薦 系統(tǒng) | ||
1.一種通過替換概念性詞語進(jìn)行搜索推薦系統(tǒng),其特征在于,包括離線系統(tǒng)和在線系統(tǒng),其中:
離線系統(tǒng),用于解析識(shí)別搜索引擎日志中每條歷史記錄中包含的實(shí)體性關(guān)鍵詞,然后按照這些實(shí)體性關(guān)鍵詞所屬的類別,為這些歷史記錄建立索引,以供在線系統(tǒng)使用;
在線系統(tǒng),用于接收并解析由用戶提交的搜索引擎查詢,識(shí)別其中的概念性關(guān)鍵詞,然后根據(jù)權(quán)重,尋找與給定搜索查詢最為接近的、并且包含概念性關(guān)鍵詞意義的實(shí)體性關(guān)鍵詞的歷史查詢,然后將搜索到的查詢進(jìn)行排序,并返回給用戶一個(gè)經(jīng)過排序后的推薦列表,由用戶選擇其認(rèn)為更為貼近的查詢,進(jìn)行二次查詢。
2.根據(jù)權(quán)利要求1所述的通過替換概念性詞語進(jìn)行搜索推薦系統(tǒng),其特征在于,所述離線模塊包括實(shí)體抽象化模塊和概念聚合模塊,其中:
實(shí)體抽象化模塊,用于識(shí)別每條歷史查詢中包含的實(shí)體性關(guān)鍵詞,再將識(shí)別到的實(shí)體性關(guān)鍵詞抽象化到對應(yīng)的概念性關(guān)鍵詞,然后交給概念聚合模塊處理;
概念聚合模塊,用于將包含相同概念的歷史查詢聚合到一起,建立索引;對于每一條歷史查詢,實(shí)體抽象化模塊識(shí)別出其中包含的實(shí)體性關(guān)鍵詞、以及它們對應(yīng)的概念,概念聚合模塊根據(jù)這些概念,將包含相同概念的歷史查詢聚合到一起;建立一個(gè)以概念為主鍵的索引,交給在線系統(tǒng)使用。
3.根據(jù)權(quán)利要求1所述的通過替換概念性詞語進(jìn)行搜索推薦系統(tǒng),其特征在于,所述在線系統(tǒng)包括概念分析模塊、索引檢索模塊和打分排序模塊,其中:
概念分析模塊,用于識(shí)別用戶提交的搜索查詢中的概念性關(guān)鍵詞;
索引檢索模塊,用于根據(jù)概念分析模塊識(shí)別出的概念性關(guān)鍵詞,遍歷由離線系統(tǒng)生成的索引,找到所有包含與識(shí)別出的概念性關(guān)鍵詞相一致的實(shí)體性關(guān)鍵詞的歷史查詢,將這些歷史查詢作為候選推薦查詢;
打分排序模塊,用于給所有索引檢索模塊找到的候選推薦查詢打分,并且排序,最后將排好序的候選推薦列表的一部分返回給用戶選擇。
4.根據(jù)權(quán)利要求3所述的通過替換概念性詞語進(jìn)行搜索推薦系統(tǒng),其特征在于,所述打分被定義為距離,其包含三個(gè)部分:語義距離、字面距離以及歷史查詢的質(zhì)量。
5.根據(jù)權(quán)利要求4所述的通過替換概念性詞語進(jìn)行搜索推薦系統(tǒng),其特征在于,所述語義距離是用來描述用戶查詢原有的概念性關(guān)鍵詞與替換的實(shí)體性關(guān)鍵詞的典型性的,典型性用如下公式定義:
其中,Typicality(instance,concept)表示對于給定概念,一個(gè)實(shí)體對于這個(gè)概念的典型程度,F(xiàn)req(instance,concept)表示一個(gè)實(shí)體與一個(gè)概念共同出現(xiàn)的頻率,F(xiàn)req(concept)表示給定概念在語料庫中的頻率,instance表示一個(gè)實(shí)體,concept表示一個(gè)概念;
并用如下公式做變換:
其中,SemDist(typ)表示語義距離,typ表示一個(gè)典型度的值,由Typicality(instance,concept)公式計(jì)算出,e為自然底數(shù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海交通大學(xué),未經(jīng)上海交通大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310501114.X/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)





