[發(fā)明專(zhuān)利]用于擴(kuò)展查詢式的方法和裝置有效
| 申請(qǐng)?zhí)枺?/td> | 201710867794.5 | 申請(qǐng)日: | 2017-09-22 |
| 公開(kāi)(公告)號(hào): | CN107609152B | 公開(kāi)(公告)日: | 2021-03-09 |
| 發(fā)明(設(shè)計(jì))人: | 鐘輝強(qiáng);尹存祥;沈劍平;徐國(guó)強(qiáng) | 申請(qǐng)(專(zhuān)利權(quán))人: | 百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司 |
| 主分類(lèi)號(hào): | G06F16/951 | 分類(lèi)號(hào): | G06F16/951;G06F16/953;G06F16/9532;G06F16/955 |
| 代理公司: | 北京英賽嘉華知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司 11204 | 代理人: | 王達(dá)佐;馬曉亞 |
| 地址: | 100085 北京市*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 擴(kuò)展 查詢 方法 裝置 | ||
本申請(qǐng)公開(kāi)了用于擴(kuò)展查詢式的方法和裝置。該方法的一具體實(shí)施方式包括:基于與目標(biāo)查詢式關(guān)聯(lián)的圖片點(diǎn)擊日志計(jì)算目標(biāo)查詢式的圖片點(diǎn)擊特征向量;基于目標(biāo)查詢式的圖片點(diǎn)擊特征向量,在預(yù)設(shè)的查詢式集合中查找目標(biāo)查詢式的相似查詢式,得到目標(biāo)查詢式的候選擴(kuò)展查詢式集合;將目標(biāo)查詢式和各候選擴(kuò)展查詢式與知識(shí)圖譜中的實(shí)體詞和限定詞匹配,以提取出目標(biāo)查詢式和各候選擴(kuò)展查詢式的實(shí)體詞和限定詞;結(jié)合知識(shí)圖譜對(duì)目標(biāo)查詢式和各候選擴(kuò)展查詢式的實(shí)體詞和限定詞進(jìn)行擴(kuò)展;對(duì)目標(biāo)查詢式和各候選擴(kuò)展查詢式的實(shí)體詞和限定詞的擴(kuò)展結(jié)果進(jìn)行匹配,以從候選擴(kuò)展查詢式集合中確定出目標(biāo)查詢式的擴(kuò)展查詢式。該實(shí)施方式提升了擴(kuò)展查詢式的豐富性。
技術(shù)領(lǐng)域
本申請(qǐng)涉及計(jì)算機(jī)技術(shù)領(lǐng)域,具體涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,尤其涉及用于擴(kuò)展查詢式的方法和裝置。
背景技術(shù)
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,產(chǎn)生了越來(lái)越多的互聯(lián)網(wǎng)數(shù)據(jù)。搜索引擎是用戶獲取互聯(lián)網(wǎng)數(shù)據(jù)的一個(gè)重要途徑。用戶輸入查詢關(guān)鍵詞,搜索引擎根據(jù)關(guān)鍵詞生成查詢式(query)并在海量的互聯(lián)網(wǎng)數(shù)據(jù)中檢索出用戶需要的信息。
通常搜索引擎可以根據(jù)用戶輸入的查詢關(guān)鍵詞進(jìn)行擴(kuò)展,推薦一些相關(guān)性較高的查詢式,或直接將查詢式擴(kuò)展到相關(guān)性較高的查詢式進(jìn)行查詢,以便高效地為用戶提供需要的信息。現(xiàn)有的查詢式擴(kuò)展方式通常基于預(yù)先設(shè)定的query數(shù)據(jù)庫(kù),query數(shù)據(jù)庫(kù)中設(shè)定了每個(gè)查詢式的關(guān)聯(lián)查詢式,在根據(jù)用戶輸入的查詢關(guān)鍵詞生成查詢式后,在預(yù)先設(shè)定的query數(shù)據(jù)庫(kù)中查詢出關(guān)聯(lián)查詢式。這種方式依賴于根據(jù)經(jīng)驗(yàn)設(shè)定的query數(shù)據(jù)庫(kù),不能很好地保證查詢式與擴(kuò)展查詢式之間的相關(guān)性,且擴(kuò)展得出的查詢式的豐富性和多樣性有待提升。
發(fā)明內(nèi)容
為了解決上述背景技術(shù)部分提到的一個(gè)或多個(gè)技術(shù)問(wèn)題,本申請(qǐng)實(shí)施例提供了用于擴(kuò)展查詢式的方法和裝置。
一方面,本申請(qǐng)實(shí)施例提供了一種用于擴(kuò)展查詢式的方法,包括:基于已獲取的與目標(biāo)查詢式關(guān)聯(lián)的圖片點(diǎn)擊日志計(jì)算目標(biāo)查詢式的圖片點(diǎn)擊特征向量;基于目標(biāo)查詢式的圖片點(diǎn)擊特征向量,在預(yù)設(shè)的查詢式集合中查找目標(biāo)查詢式的相似查詢式,得到目標(biāo)查詢式的候選擴(kuò)展查詢式集合;將目標(biāo)查詢式和候選擴(kuò)展查詢式集合中的各候選擴(kuò)展查詢式與知識(shí)圖譜中的實(shí)體詞和限定詞匹配,以提取出目標(biāo)查詢式的實(shí)體詞和限定詞、以及各候選擴(kuò)展查詢式的實(shí)體詞和限定詞;結(jié)合知識(shí)圖譜對(duì)目標(biāo)查詢式和各候選擴(kuò)展查詢式的實(shí)體詞和限定詞進(jìn)行擴(kuò)展;利用目標(biāo)查詢式和各候選擴(kuò)展查詢式的實(shí)體詞和限定詞的擴(kuò)展結(jié)果進(jìn)行匹配,以從候選擴(kuò)展查詢式集合中確定出目標(biāo)查詢式的擴(kuò)展查詢式。
在一些實(shí)施例中,上述基于已獲取的與目標(biāo)查詢式關(guān)聯(lián)的圖片點(diǎn)擊日志計(jì)算目標(biāo)查詢式的圖片點(diǎn)擊特征向量,包括:基于已獲取的與目標(biāo)查詢式關(guān)聯(lián)的圖片點(diǎn)擊日志統(tǒng)計(jì)各預(yù)設(shè)時(shí)間窗口內(nèi)與目標(biāo)查詢式關(guān)聯(lián)的圖片的點(diǎn)擊數(shù)量;對(duì)統(tǒng)計(jì)結(jié)果中小于預(yù)設(shè)點(diǎn)擊量閾值的點(diǎn)擊數(shù)量進(jìn)行清洗,基于清洗后的各預(yù)設(shè)時(shí)間窗口內(nèi)的與目標(biāo)查詢式關(guān)聯(lián)的圖片的點(diǎn)擊數(shù)量構(gòu)建圖片點(diǎn)擊特征向量。
在一些實(shí)施例中,上述基于目標(biāo)查詢式的圖片點(diǎn)擊特征向量,在預(yù)設(shè)的查詢式集合中查找目標(biāo)查詢式的相似查詢式,得到目標(biāo)查詢式的候選擴(kuò)展查詢式集合,包括:對(duì)預(yù)設(shè)的查詢式集合中的各個(gè)查詢式,統(tǒng)計(jì)與查詢式關(guān)聯(lián)的圖片的點(diǎn)擊數(shù)量,以構(gòu)建預(yù)設(shè)的查詢式集合中各查詢式的圖片點(diǎn)擊特征向量;計(jì)算預(yù)設(shè)的查詢式集合中的各查詢式的圖片點(diǎn)擊特征向量與目標(biāo)查詢式的圖片點(diǎn)擊特征向量的相似度;將與目標(biāo)查詢式的圖片點(diǎn)擊特征向量的相似度大于預(yù)設(shè)相似度閾值的圖片點(diǎn)擊特征向量對(duì)應(yīng)的查詢式作為候選擴(kuò)展查詢式,形成候選擴(kuò)展查詢式集合。
在一些實(shí)施例中,上述將目標(biāo)查詢式和候選擴(kuò)展查詢式集合中的各候選擴(kuò)展查詢式與知識(shí)圖譜中的實(shí)體詞和限定詞匹配,以提取出目標(biāo)查詢式的實(shí)體詞和限定詞、以及各候選擴(kuò)展查詢式的實(shí)體詞和限定詞,包括:對(duì)目標(biāo)查詢式和候選擴(kuò)展查詢式集合中的各候選擴(kuò)展查詢式進(jìn)行切詞;將切詞得到的詞語(yǔ)與知識(shí)圖譜中的實(shí)體詞進(jìn)行匹配,得到目標(biāo)查詢式的實(shí)體詞和各候選擴(kuò)展查詢式的實(shí)體詞;將切詞得到的詞語(yǔ)與知識(shí)圖譜中的實(shí)體詞的限定詞進(jìn)行匹配,得到目標(biāo)查詢式的限定詞和各候選擴(kuò)展查詢式的限定詞。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司,未經(jīng)百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710867794.5/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 帶有前處理和后處理的數(shù)據(jù)庫(kù)復(fù)合查詢系統(tǒng)及方法
- 數(shù)據(jù)庫(kù)查詢的方法和系統(tǒng)
- 查詢系統(tǒng)、查詢終端以及查詢方法
- 交易信息查詢方法、查詢裝置及查詢系統(tǒng)
- 數(shù)據(jù)查詢與結(jié)果生成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 在RDF數(shù)據(jù)集上進(jìn)行OPTIONAL查詢的方法及存儲(chǔ)介質(zhì)
- 一種多表關(guān)聯(lián)查詢方法、裝置及設(shè)備
- 一種基于Impala的查詢方法和裝置
- 從查詢生成子查詢
- 一種基于通用查詢語(yǔ)言的查詢方法及查詢系統(tǒng)
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





