[發(fā)明專利]基于語義相似度與時(shí)效性頻率的查詢推薦排序方法與裝置有效

申請(qǐng)?zhí)枺?/td>	201710296992.0	申請(qǐng)日：	2017-04-28
公開（公告）號(hào)：	CN107122469B	公開（公告）日：	2019-12-17
發(fā)明（設(shè)計(jì)）人：	蔡飛;陳洪輝;陳皖玉;劉俊先;羅愛民;陳濤;舒振;羅雪山;郭昱普	申請(qǐng)（專利權(quán)）人：	中國(guó)人民解放軍國(guó)防科學(xué)技術(shù)大學(xué)
主分類號(hào)：	G06F16/9535	分類號(hào)：	G06F16/9535;G06F17/27
代理公司：	11270 北京派特恩知識(shí)產(chǎn)權(quán)代理有限公司	代理人：	蔣雅潔;張穎玲
地址：	410003 湖***	國(guó)省代碼：	湖南;43
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	基于語義相似時(shí)效性頻率查詢推薦排序方法裝置
鉆瓜網(wǎng) 技術(shù)展會(huì) 專利詞庫(kù) 專利權(quán)人專利榜在售專利公布日期熱門專利

【權(quán)利要求書】：

1.一種基于語義相似度與時(shí)效性頻率的查詢推薦排序方法，其特征在于，包括：

獲取用戶查詢記錄數(shù)據(jù)集并采集查詢?cè)~前綴；

根據(jù)查詢?cè)~前綴生成查詢推薦列表并確定時(shí)效性頻率的查詢字排序；

根據(jù)用戶查詢記錄數(shù)據(jù)集與訓(xùn)練用文本數(shù)據(jù)集計(jì)算查詢?cè)~中第一查詢字與其他查詢字的語義相似度，并確定語義相似度的查詢?cè)~排序；

根據(jù)時(shí)效性頻率排序、語義相似度排序與字詞權(quán)衡參數(shù)獲得查詢推薦排序，并根據(jù)查詢推薦排序?qū)Σ樵兺扑]列表中的每個(gè)查詢?cè)~排序顯示；

對(duì)一個(gè)查詢推薦的排序問題，由于公式

分母中的λ值并不影響查詢推薦之間的相對(duì)順序，因此，最終的查詢推薦排序得分簡(jiǎn)化為：

p(q|p)∝p(w|p)×(p(q|w)+λ-1)；

2.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述確定時(shí)效性頻率的查詢字排序包括：

提取查詢推薦列表所有查詢?cè)~中的第一查詢字；

從用戶查詢記錄數(shù)據(jù)集中獲取每個(gè)查詢字在指定時(shí)間內(nèi)的出現(xiàn)頻率；

根據(jù)所有查詢?cè)~的第一查詢字與每個(gè)查詢字在指定時(shí)間內(nèi)的出現(xiàn)頻率確定時(shí)效性頻率的查詢字排序。

3.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述根據(jù)用戶查詢記錄數(shù)據(jù)集與訓(xùn)練用文本數(shù)據(jù)集計(jì)算查詢?cè)~中第一查詢字與其他查詢字的語義相似度包括：

根據(jù)用戶查詢記錄數(shù)據(jù)集獲得基于用戶查詢記錄數(shù)據(jù)集的第一查詢字與其他查詢字之間的語義相似度；

根據(jù)訓(xùn)練用文本數(shù)據(jù)集獲得基于訓(xùn)練用文本數(shù)據(jù)集的第一查詢字與其他查詢字之間的語義相似度；

根據(jù)基于用戶查詢記錄數(shù)據(jù)集的第一查詢字、其他查詢字之間的語義相似度與基于訓(xùn)練用文本數(shù)據(jù)集的第一查詢字與其他查詢字之間的語義相似度與語義整合權(quán)衡參數(shù)確定查詢?cè)~中第一查詢字與其他查詢字的語義相似度；

針對(duì)搜集到的用戶查詢記錄，訓(xùn)練Skip-gram模型，這樣確保測(cè)試階段的每個(gè)查詢中的查詢字能被Skip-gram模型的向量表示；基于用戶查詢記錄生成的Skip-gram模型，計(jì)算查詢?cè)~q中第一個(gè)查詢字w₁與其他查詢字w_i∈q之間的語義相似度，以Sq(w_i,w₁)表示；最后，公式

中的查詢字之間的語義相似度p(w_i|w₁)通過如下計(jì)算而得：

p(w_i|w₁)＝ω×S_r(w_i，w₁)+(1-ω)×S_q(w_i，w₁)

其中，Ssem為語義相似度，q為查詢?cè)~，w為基于查詢?cè)~的第一個(gè)查詢字，p為查詢前綴，Sr(wi,w1)是基于Google-News文本數(shù)據(jù)集訓(xùn)練獲得的查詢字w₁與其他查詢字w_i∈q之間的語義相似度，S_q(w_i，w₁)基于用戶查詢記錄數(shù)據(jù)集訓(xùn)練獲得的查詢字w₁與其他查詢字w_i∈q之間的語義相似度，采用ω來線性整合，獲取最終查詢字之間的語義相似度，ω是一個(gè)權(quán)衡參數(shù)，在[0,1]之間。

4.根據(jù)權(quán)利要求3所述的方法，其特征在于，所述根據(jù)用戶查詢記錄數(shù)據(jù)集獲得基于用戶查詢記錄數(shù)據(jù)集的第一查詢字與其他查詢字之間的語義相似度包括：

使用用戶查詢記錄數(shù)據(jù)集訓(xùn)練skip-gram模型；

根據(jù)用戶查詢記錄數(shù)據(jù)集訓(xùn)練的skip-gram模型獲得基于用戶查詢記錄數(shù)據(jù)集的第一查詢字與其他查詢字之間的語義相似度。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會(huì)員可以免費(fèi)下載。

免登錄下載普通用戶下載升級(jí)VIP會(huì)員，免費(fèi)下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國(guó)人民解放軍國(guó)防科學(xué)技術(shù)大學(xué)，未經(jīng)中國(guó)人民解放軍國(guó)防科學(xué)技術(shù)大學(xué)許可，擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請(qǐng)聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201710296992.0/1.html，轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。

上一篇：一種已鑒定文物的信息存檔方法
下一篇：一種繼電保護(hù)動(dòng)作范圍可視化方法

同類專利

專利分類

G 物理

G06 計(jì)算；推算；計(jì)數(shù)
G06F 電數(shù)字?jǐn)?shù)據(jù)處理

免登錄下載普通用戶下載升級(jí)VIP會(huì)員，免費(fèi)下載

專利文獻(xiàn)下載

說明：

1、專利原文基于中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實(shí)用新型專利、外觀設(shè)計(jì)專利（升級(jí)中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級(jí)為極速版,下載速度顯著提升！歡迎使用！

請(qǐng)您登陸后，進(jìn)行下載，點(diǎn)擊【登陸】【注冊(cè)】