[發明專利]LBSN中基于好友聚類的社交搜索評價方法有效
| 申請號: | 201710335698.6 | 申請日: | 2017-05-12 |
| 公開(公告)號: | CN107194560B | 公開(公告)日: | 2020-11-27 |
| 發明(設計)人: | 曹玖新;孫洋;周丹丹 | 申請(專利權)人: | 東南大學 |
| 主分類號: | G06Q10/06 | 分類號: | G06Q10/06;G06Q50/00;G06F16/35 |
| 代理公司: | 南京眾聯專利代理有限公司 32206 | 代理人: | 杜靜靜 |
| 地址: | 211189 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | lbsn 基于 好友 社交 搜索 評價 方法 | ||
本發明公開了LBSN中一種基于好友聚類的社交搜索評價方法。從Foursquare真實數據集中提取基于位置信息和聯系人信息等多維特征,提出基于好友聚類的KNN搜索算法,設計基于倒排索引的搜索引擎,結合距離等因素使搜索結果更加精確、搜索速度得到提升。為使搜索結果更加精確,首先,在研究用戶好友的基礎上,對好友進行聚類。由于LBSN屬于異構網絡,數據集比較稀疏,通過聚類可以使數據更加稠密,消除奇異點,降低因數據稀疏導致的不利影響;其次,搜索算法的設計上,在考慮了傳統社交影響力的基礎上,增加了專業相關度和距離遠近兩個指標,即綜合搜索得分、社交得分和距離得分。最后,綜合三個指標構建并訓練線性規劃模型得到搜索結果,使得搜索結果是用戶滿意的。
技術領域
本發明涉及一種評價方法,具體涉及一種LBSN中基于好友聚類的社交搜索評價方法,屬于社交搜索技術領域。
背景技術
在線社交網絡(OSNs)的發展給人們的日常生活帶來了極大的便利,如今每天有多達數十億的用戶活躍在OSNs上,產生了大量的社交信息。漸漸地,人們更喜歡通過OSNs搜索信息而不是傳統的搜索引擎,社交搜索便應運而生。由于傳統搜索方式有查準率低,用戶篩選時間長,搜索結果一致化等缺點,在用戶個性化搜索的背景下,社交搜索依托于傳統的搜索原理,結合用戶的社交信息,可以產生個性化的搜索結果,提高搜索精度。特別是基于位置的社交網絡(LBSNs)的出現,在移動電話等移動設備和GPS、WiFi等移動技術的支持下,為社交搜索的移動化研究提供了重要的研究平臺。
LBSN平臺上對社交搜索的研究成果很少,對社交搜索的研究主要在兩方面:設計搜索引擎和改進搜索算法。雖然現有研究都在充分挖掘LBSNs提供的聯系人信息和位置信息,不過依然有很多不足之處。有的研究更注重搜索速度的提升,通過改進索引結構提高搜索速度,忽視了數據集的稀疏問題,進而影響了搜索精度;有的研究分析位置點上發生的具體事件,比如地震,火災等,實現對特定位置點發生的事件的搜索,但缺少搜索對象領域的廣泛化,領域比較單一,不能較好滿足現實需求;有的研究由于評價方法如相似度度量標準主觀且社交搜索系統的負載過大,導致搜索效果仍有提高的空間。
發明內容
本發明正是針對現有技術中存在的技術問題,提供一種LBSN中基于好友聚類的社交搜索評價方法,該技術方案在于通過設計基于位置信息和聯系人信息等多維特征,提出基于好友聚類的KNN搜索算法,設計基于倒排索引的搜索引擎,結合距離等因素使搜索結果更加精確、搜索速度得到提升。其中,搜索算法綜合考慮了三種排序得分:搜索得分即基于專業相關性的位置排序、社交得分即基于社交影響力的位置排序、空間得分即基于距離遠近的位置排序。
為了實現上述目的,本發明的技術方案如下,一種LBSN中基于好友聚類的社交搜索評價方法,其特征在于,所述評價方法包括以下步驟,1)爬取的Foursquare真實數據集中有聯系人信息和位置信息,通過對數據的統計與分析,提取出聯系人特征、簽到特征、評價特征和時間特征,共15種數據類型,包括用戶ID、好友ID、簽到ID、簽到位置描述、簽到發生時區、簽到位置ID、簽到位置經緯度、簽到位置名稱、簽到位置的類型ID、簽到位置的類型名稱、簽到發生時間、評價文本ID、評價文本內容、評價發生時間,構建社交搜索模型并給出形式化描述,篩選發生在紐約的數據集,這種方法同樣適用于其他城市;
2)從步驟1)處理好的數據集中提取位置名稱、位置類型、位置描述三種數據類型,構建“位置名稱-文檔”式倒排索引,在此基礎上,基于Lucene技術構建社交搜索引擎;
3)線上部分設計搜索算法,在基于搜索得分的位置排序部分,搜索用戶輸入搜索內容,經語義分詞產生話題,與步驟2倒排索引中的文檔進行相似度匹配,根據專業相關性得分索引出備選位置和基于得分的位置排序;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東南大學,未經東南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710335698.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:電磁組合直線振動式混合顆粒分選裝置
- 下一篇:履帶移動式水平篩分站
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





