[發(fā)明專利]一種分布式環(huán)境下基于社會(huì)感知的空間關(guān)鍵字查詢方法有效
| 申請(qǐng)?zhí)枺?/td> | 201810875808.2 | 申請(qǐng)日: | 2018-08-03 |
| 公開(kāi)(公告)號(hào): | CN108932347B | 公開(kāi)(公告)日: | 2021-11-16 |
| 發(fā)明(設(shè)計(jì))人: | 趙相國(guó);袁野;孫永佼 | 申請(qǐng)(專利權(quán))人: | 東北大學(xué) |
| 主分類號(hào): | G06F16/9537 | 分類號(hào): | G06F16/9537;G06F16/14;G06F16/13;G06F16/182 |
| 代理公司: | 北京君泊知識(shí)產(chǎn)權(quán)代理有限公司 11496 | 代理人: | 王程遠(yuǎn) |
| 地址: | 110819 遼寧*** | 國(guó)省代碼: | 遼寧;21 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 分布式 環(huán)境 基于 社會(huì) 感知 空間 關(guān)鍵字 查詢 方法 | ||
本發(fā)明公開(kāi)了一種分布式環(huán)境下基于社會(huì)感知的空間關(guān)鍵字查詢方法,通過(guò)對(duì)Top?k查詢問(wèn)題進(jìn)行分析,提出解決該問(wèn)題的索引和查詢框架,索引結(jié)構(gòu)引入了社交信息,利用關(guān)鍵字的檢索特點(diǎn),在SDPR分布式索引結(jié)構(gòu)的基礎(chǔ)上提出基于的社會(huì)感知的Top?k查詢算法,通過(guò)輸入查詢參數(shù),結(jié)果是數(shù)據(jù)集中滿足特定排序函數(shù)排名最高的前k個(gè)對(duì)象,通過(guò)帶有權(quán)重的空間關(guān)鍵字查詢,使得查詢更加精準(zhǔn),能夠得到更加準(zhǔn)確的結(jié)果。
技術(shù)領(lǐng)域
本發(fā)明涉及檢索技術(shù)領(lǐng)域,尤其涉及一種分布式環(huán)境下基于社會(huì)感知的空間關(guān)鍵字查詢方法。
背景技術(shù)
隨著互聯(lián)網(wǎng)的發(fā)展,各種社交網(wǎng)絡(luò)服務(wù)產(chǎn)品應(yīng)運(yùn)而生,這些社交網(wǎng)絡(luò)服務(wù)被普遍使用,已然成為最受用戶歡迎的應(yīng)用,基于位置的社交網(wǎng)絡(luò)也因此包含著大量有價(jià)值有意義帶有地理位置數(shù)據(jù),空間數(shù)據(jù)逐漸成為學(xué)術(shù)研究重要的研究對(duì)象,所謂的空間數(shù)據(jù)就是包含地理位置和文本信息的數(shù)據(jù),在空間中查詢包含地理信息和文本信息成為頻繁的操作,空間關(guān)鍵字查詢就是在大量的空間目標(biāo)中查詢到符合地理相關(guān),文本相關(guān)的數(shù)據(jù)。
近幾年來(lái),通信技術(shù)的發(fā)展和移動(dòng)終端的廣泛使用,基于位置的社會(huì)服務(wù)也層出不窮,空間關(guān)鍵字查詢是以用戶的地理位置信息和多個(gè)查詢關(guān)鍵字作為參數(shù),返回的是和這些參數(shù)有著空間和文本相關(guān)度的空間對(duì)象。在一個(gè)查詢中,構(gòu)建有效的索引結(jié)構(gòu),可以極大地提高查詢效率。對(duì)于一個(gè)空間中的索引,是指將對(duì)象的位置信息,大小形狀等按照一定結(jié)構(gòu)排列的一種數(shù)據(jù)結(jié)構(gòu)。
常見(jiàn)的基于二叉樹的索引技術(shù),這是較早版本的索引技術(shù),適用于空間中點(diǎn)狀常見(jiàn)的有KD樹,LSD樹,K-D-B樹等相關(guān)索引結(jié)構(gòu),然而對(duì)于拓展對(duì)象卻不適用。由于空間的對(duì)象形態(tài)各異(如點(diǎn),線,面,體等),組織方式不同,也導(dǎo)致了處理空間中拓展對(duì)象的方式也不相同,主要分為對(duì)空間中對(duì)象映射,分割和界定三類,將空間中的對(duì)象分割,分別存儲(chǔ)在不重疊相交的子空間中,這種類型的空間索引技術(shù)有R+樹,四叉樹,Cell樹等。對(duì)象的界定又被叫做區(qū)域重疊,也就是說(shuō)它允許其子空間重疊,常見(jiàn)的有R樹,R*樹。
隨著用戶量越來(lái)越多,產(chǎn)生了大量的社交數(shù)據(jù),空間數(shù)據(jù)還有社交數(shù)據(jù)呈指數(shù)增長(zhǎng),導(dǎo)致搜索空間越來(lái)越大,傳統(tǒng)的數(shù)據(jù)處理技術(shù)在面對(duì)如此龐大的數(shù)據(jù)量時(shí)存在很多問(wèn)題,處理數(shù)據(jù)成本很高,存在效率很低問(wèn)題,空間數(shù)據(jù)的并行化處理難度較高,并行程序編寫比較難。集中式環(huán)境下的查詢處理效率面臨著極大的挑戰(zhàn),傳統(tǒng)的空間關(guān)鍵字查詢已經(jīng)不能解決現(xiàn)狀。
雖然現(xiàn)在的搜索引擎技術(shù)已經(jīng)很成熟,能夠在短時(shí)間內(nèi)給用戶返回大量相關(guān)的數(shù)據(jù),可是搜索引擎返回的結(jié)果并不一定跟查詢用戶相關(guān),沒(méi)有考慮查詢用戶的社交關(guān)系,返回的結(jié)果可能并不是用戶關(guān)心的。傳統(tǒng)的空間關(guān)鍵字查詢查詢參數(shù)包含查詢,位置信息和文本信息,這并不能給用戶返回個(gè)性化的結(jié)果,因而將社交數(shù)據(jù)加入到空間關(guān)鍵字查詢中以提高查詢結(jié)果的質(zhì)量。
發(fā)明內(nèi)容
針對(duì)上述缺陷或不足,本發(fā)明的目的在于提供一種分布式環(huán)境下基于社會(huì)感知的空間關(guān)鍵字查詢方法,提高查詢速度。
為達(dá)到以上目的,本發(fā)明的技術(shù)方案為:
一種分布式環(huán)境下基于社會(huì)感知的空間關(guān)鍵字查詢方法,包括:
第一步、加載SDPR樹全局的索引,在SDPR樹全局的索引樹中獲取查詢點(diǎn)集中的查詢點(diǎn)所在的分區(qū);
第二步、在所獲取的分區(qū)內(nèi)分別指向SkSK操作,查詢找到距離該查詢點(diǎn)最近的k個(gè)空間對(duì)象;
第三步、在k個(gè)空間對(duì)象中得到的預(yù)定個(gè)數(shù)最相關(guān)的空間對(duì)象,然后進(jìn)行結(jié)果的排序,獲取最終結(jié)果。
1)、獲取空間數(shù)據(jù),所述空間數(shù)據(jù)包括若干空間對(duì)象,每個(gè)空間對(duì)象包括對(duì)應(yīng)的空間對(duì)象標(biāo)示、空間對(duì)象的地理位置信息、空間中描述對(duì)象的關(guān)鍵字、以及空間對(duì)象的粉絲群體;
2)、利用空間層次分解的Hilbert編碼方式對(duì)空間數(shù)據(jù)進(jìn)行數(shù)據(jù)劃分,將空間的數(shù)據(jù)劃分到數(shù)據(jù)分區(qū);
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于東北大學(xué),未經(jīng)東北大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810875808.2/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 環(huán)境服務(wù)系統(tǒng)以及環(huán)境服務(wù)事業(yè)
- 環(huán)境控制裝置、環(huán)境控制方法、環(huán)境控制程序及環(huán)境控制系統(tǒng)
- 環(huán)境檢測(cè)終端和環(huán)境檢測(cè)系統(tǒng)
- 環(huán)境調(diào)整系統(tǒng)、環(huán)境調(diào)整方法及環(huán)境調(diào)整程序
- 環(huán)境估計(jì)裝置和環(huán)境估計(jì)方法
- 用于環(huán)境艙的環(huán)境控制系統(tǒng)及環(huán)境艙
- 車輛環(huán)境的環(huán)境數(shù)據(jù)處理
- 環(huán)境取樣動(dòng)力頭、環(huán)境取樣方法
- 環(huán)境艙環(huán)境控制系統(tǒng)
- 環(huán)境檢測(cè)儀(環(huán)境貓)





