[發明專利]一種基于位置的社交網絡中Top-k區域用戶文本數據推薦方法有效
| 申請號: | 201710281672.8 | 申請日: | 2017-04-18 |
| 公開(公告)號: | CN107145545B | 公開(公告)日: | 2021-01-05 |
| 發明(設計)人: | 趙相國;王國仁;孫永佼;畢鑫;張禎;喻鑫 | 申請(專利權)人: | 東北大學 |
| 主分類號: | G06F16/9536 | 分類號: | G06F16/9536;G06F16/31;G06F16/33;G06Q50/00 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 110819 遼寧*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 位置 社交 網絡 top 區域 用戶 文本 數據 推薦 方法 | ||
1.一種基于位置的社交網絡中Top-k區域用戶文本數據推薦方法,包括以下步驟:
1)、獲取需求用戶的地理位置,根據需求用戶輸入的需求,對社交網絡中的文本數據進行分詞處理,獲取與需求用戶的需求相匹配的關鍵詞組;
2)、根據獲取的關鍵詞組,建立索引樹DLIR-Tree,所述索引樹DLIR-Tree的每個節點包含一系列的社交網絡文本的發送用戶,每個節點的發送用戶都是由該節點的下一層的子樹所包含的發送用戶的集合;
3)、根據需求用戶的需求、地理位置及區域半徑查詢索引樹DLIR-Tree,得到相匹配的文本數據;
4)、對所獲取的文本數據與關鍵詞組進行相似度計算處理,得到過濾后的文本數據;
5)、根據過濾后的文本數據,進行綜合評分,并根據綜合評分完成Top-k區域用戶文本數據推薦;
所述進行綜合評分,并根據綜合評分完成Top-k區域用戶文本數據推薦具體為:
5.1、對過濾后的文本數據列表中的文本數據根據流行度計算公式進行流行度計算,得到流行文本數據,所述流行度計算公式為:
其中,p為文本數據,β是一個常量,Ti表示該層節點對應文本數據的評論與轉發數;選定初始文本數據,將初始文本數據設定為文本根節點,子節點為上層節點文本數據的點贊次數以及轉發或回復的文本數據,ki表示第i層的節點對應文本數據的點贊數;
5.2、根據關鍵詞相關關系的文本數據評分公式,獲得相關文本數據;所述相關關系的文本數據評分公式:
其中,|p.w∩q.w|為需求關鍵詞的出現頻率;sim(p,q)為文本數據與關鍵詞組相似度,N為歸一化參數,q為關鍵詞組;
5.3、當發送用戶在設定時間范圍內發送多個同一主題文本數據時,則結合文本數據的發送時間,根據所有相關文本數據的總和評分公式進行評分,或根據最大評分公式進行評分:
總和評分公式:
最大評分公式:
其中,p是用戶u發表的與關鍵詞組相關的微博,tp表示與用戶提出需求的時間與該微博發布時間的時間差,以月份為單位,Pu表示發送用戶u發表的所有微博的集合;
5.4、根據距離評分公式對文本數據進行距離評分,獲取距離需求用戶設定范圍內的文本數據,所述距離評分公式為:
其中,r為距離半徑,l為查詢位置,δ(p,q)為距離評分;
5.5、根據綜合用戶評分公式,獲取綜合評分文本數據列表,并按照總評分的高低進行排序,得到最高分文本數據,所述綜合用戶評分公式為:
uscore(u,q)=α·ρ(u,q)+(1-α)·δ(u,q)
其中,參數α∈(0,1),Pu表示發送用戶u發表的所有微博的集合,ρ(u,q)為ρsum(u,q)或ρmax(u,q):當存在多篇微博的時候,首先將該用戶所有與需求關鍵詞組相關的微博評分都考慮在內,然后對該用戶進行評分,本文考慮結合微博所發時間,給出一個基于用戶所有相關微博的總和評分公式;當用戶發布過的與需求關鍵詞組相關的微博最大的評分作為推薦依據,采用基于用戶所發相關微博最大評分的評分公式。
2.根據權利要求1所述的基于位置的社交網絡中Top-k區域用戶文本數據推薦方法,其特征在于,所述步驟1)具體包括:
1.1、對待處理的文本數據進行分詞停用詞、標點符號、表情處理,得到處理后的文本數據;
1.2、利用正向匹配策略與逆向匹配策略對處理后的文本數據對文本數據分詞,通過相互的信息比對,以及歧義詞語對的互信值比較,以互信值高一組為最終的分詞結果,輸出分詞集合。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東北大學,未經東北大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710281672.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種帶有前進助力的助行器
- 下一篇:一種直流控制柜電源控制裝置





