[發(fā)明專利]一種社交網(wǎng)絡(luò)用戶虛實映射方法和系統(tǒng)在審
| 申請?zhí)枺?/td> | 201410042782.5 | 申請日: | 2014-01-29 |
| 公開(公告)號: | CN103745014A | 公開(公告)日: | 2014-04-23 |
| 發(fā)明(設(shè)計)人: | 梁英;胡開先;許洪波;程學(xué)旗;張國清 | 申請(專利權(quán))人: | 中國科學(xué)院計算技術(shù)研究所 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京泛華偉業(yè)知識產(chǎn)權(quán)代理有限公司 11280 | 代理人: | 王勇 |
| 地址: | 100190 北*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 社交 網(wǎng)絡(luò) 用戶 虛實 映射 方法 系統(tǒng) | ||
技術(shù)領(lǐng)域
本發(fā)明涉及計算機(jī)數(shù)據(jù)挖掘分析領(lǐng)域,尤其涉及一種社交網(wǎng)絡(luò)用戶虛實映射方法和系統(tǒng)。
背景技術(shù)
隨著互聯(lián)網(wǎng)的不斷發(fā)展,社交網(wǎng)絡(luò)在人們生活中扮演著重要的角色,微博、微信、人人網(wǎng)等已經(jīng)成為人們獲取信息、展示自我和營銷推廣的重要手段。通過社交網(wǎng)絡(luò),人們可以方便地以虛擬身份自由發(fā)表觀點和意見,每個人都是信息的生產(chǎn)者和消費者,形成“自媒體”。匿名的社交網(wǎng)絡(luò)在一定程度上保護(hù)了用戶的隱私,但同樣也帶來了很多問題。比如,不易追蹤網(wǎng)絡(luò)虛假消息的發(fā)布者、不易定位危害國家治安言論的發(fā)布者、不易在網(wǎng)絡(luò)中追查違法犯罪行為等。盡管我國推出了網(wǎng)絡(luò)實名制注冊政策,但面對無邊界的網(wǎng)絡(luò)社會,實名制需要全國統(tǒng)一,甚至需要與世界接軌,因此在實施過程中困難重重。此外,即使是采用了實名制注冊也是后臺實名,而前臺顯示仍使用昵稱的匿名形式。因此,在網(wǎng)絡(luò)的虛擬性、匿名性等特征下,根據(jù)用戶在社交網(wǎng)絡(luò)中的虛擬身份來識別用戶的真實身份,即實現(xiàn)用戶的虛實映射,具有積極的社會意義。
目前,針對社交網(wǎng)絡(luò)中用戶虛實映射的研究主要包括以下兩個方面:一類是基于網(wǎng)絡(luò)IP地址定位網(wǎng)絡(luò)設(shè)備,如通過分析移動設(shè)備IP地址,網(wǎng)絡(luò)設(shè)備IP地址及臺式電腦IP地址等來獲取設(shè)備所在的省市信息;另一類是通過人物特征屬性對某個用戶群體進(jìn)行識別,用戶的特征屬性可以包括性別、年齡段、居住地、畢業(yè)院校、性格、星座、愛好、職業(yè)等,通過挖掘網(wǎng)絡(luò)數(shù)據(jù)來識別用戶特征屬性,可以將擁有相同或相似特征屬性的用戶群挖掘出來,以便為網(wǎng)絡(luò)營銷、電商廣告提供服務(wù)。
然而,由于實踐中難以獲得社交網(wǎng)絡(luò)用戶的IP信息,因此前一類方法的適用范圍受到一定限制,不能滿足IP缺失的社交網(wǎng)絡(luò)用戶的虛實映射需求;而第二類方法面向擁有相似特征的用戶群,并不是面向個人用戶,其偏向于挖掘用戶的特征屬性分類,并不能識別用戶的真實身份。
發(fā)明內(nèi)容
為解決現(xiàn)有技術(shù)中存在的問題,本發(fā)明提供一種社交網(wǎng)絡(luò)用戶虛實映射方法,所述方法包括:
步驟1)、根據(jù)社交網(wǎng)絡(luò)用戶的唯一標(biāo)識獲取該社交網(wǎng)絡(luò)用戶的地理位置信息,并且獲取該地理位置信息對應(yīng)的地理位置的周邊單位名稱列表;
步驟2)、將所述周邊單位名稱列表中的每個單位名稱與所述社交網(wǎng)絡(luò)用戶發(fā)布的消息內(nèi)容進(jìn)行匹配,根據(jù)匹配程度選擇一個或多個單位名稱。
在一個實施例中,步驟1)還包括:對所述周邊單位名稱列表中的每個單位名稱進(jìn)行分詞,得到該單位名稱的分詞結(jié)果。
在一個實施例中,在步驟2)中,將周邊單位名稱列表中的每個單位名稱與社交網(wǎng)絡(luò)用戶發(fā)布的消息內(nèi)容進(jìn)行匹配包括:
步驟21)、將每個單位名稱的全稱與所述社交網(wǎng)絡(luò)用戶發(fā)布的消息內(nèi)容進(jìn)行匹配,如果匹配成功則使用下式計算該單位名稱的近似度權(quán)重:
weight(str)=word.size(str)*factormatchtime(sstr)
其中,str表示單位名稱,weight(str)表示單位名稱的近似度權(quán)重,word.size(str)表示單位名稱的長度,factor表示乘數(shù)因子,matchtimes(str)表示單位名稱與消息內(nèi)容的匹配成功次數(shù);
步驟22)、如果匹配不成功,則將該單位名稱的分詞結(jié)果中除該單位名稱的全稱外的每個分詞與所述社交網(wǎng)絡(luò)用戶發(fā)布的消息內(nèi)容進(jìn)行匹配,將每個分詞的匹配成功次數(shù)之和作為該單位名稱的近似度權(quán)重。
在一個實施例中,步驟2)還包括:
步驟23)、合并近似度權(quán)重相同且具有共同的最大前綴的單位名稱,使得所述共同的最大前綴包含在前綴詞庫中或者其長度達(dá)到預(yù)定長度;其中,合并后的單位名稱為所述共同的最大前綴且其近似度權(quán)重為所合并的單位名稱的近似度權(quán)重之和,所述前綴詞庫用于存放指示地理位置的前綴詞。
在進(jìn)一步的實施例中,步驟23)包括:
步驟231)、對于一種近似度權(quán)重,新建一棵Trie樹;
步驟232)、將具有該近似度權(quán)重的單位名稱插入所述Trie樹,得到具有共同的最大前綴的單位名稱;
步驟233)、如果該共同的最大前綴包含在前綴詞庫中或者其長度達(dá)到預(yù)定長度,則合并具有該共同的最大前綴且具有該近似度權(quán)重的單位名稱;其中,合并后的單位名稱為該共同的最大前綴且其近似度權(quán)重為所合并的單位名稱的近似度權(quán)重之和,所述前綴詞庫用于存放指示地理位置的前綴詞;
步驟234)、銷毀所述Trie樹;
步驟235)、對于未處理的近似度權(quán)重,返回步驟231)進(jìn)行處理。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國科學(xué)院計算技術(shù)研究所,未經(jīng)中國科學(xué)院計算技術(shù)研究所許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410042782.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 社交網(wǎng)絡(luò)裝置成員資格和應(yīng)用
- 一種社交對象搜索方法及裝置
- 針對嵌入式應(yīng)用上下文中的搜索的查詢意圖表達(dá)
- 一種關(guān)鍵社交信息的確定方法及裝置
- 社交網(wǎng)絡(luò)數(shù)據(jù)的可視化方法、裝置、設(shè)備及存儲介質(zhì)
- 動態(tài)社交圈確定方法、裝置、設(shè)備及存儲介質(zhì)
- 控制社交分享信息在社交空間的呈現(xiàn)狀態(tài)的方法與設(shè)備
- 社交角色管理方法、計算機(jī)設(shè)備及存儲介質(zhì)
- 基于社交關(guān)系的社交屬性數(shù)據(jù)確定方法、裝置及設(shè)備
- 一種社交賬戶推薦方法、裝置、電子設(shè)備和存儲介質(zhì)
- 網(wǎng)絡(luò)和網(wǎng)絡(luò)終端
- 網(wǎng)絡(luò)DNA
- 網(wǎng)絡(luò)地址自適應(yīng)系統(tǒng)和方法及應(yīng)用系統(tǒng)和方法
- 網(wǎng)絡(luò)系統(tǒng)及網(wǎng)絡(luò)至網(wǎng)絡(luò)橋接器
- 一種電力線網(wǎng)絡(luò)中根節(jié)點網(wǎng)絡(luò)協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡(luò)定位方法、存儲介質(zhì)及移動終端
- 網(wǎng)絡(luò)裝置、網(wǎng)絡(luò)系統(tǒng)、網(wǎng)絡(luò)方法以及網(wǎng)絡(luò)程序
- 從重復(fù)網(wǎng)絡(luò)地址自動恢復(fù)的方法、網(wǎng)絡(luò)設(shè)備及其存儲介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、裝置及存儲介質(zhì)
- 網(wǎng)絡(luò)管理方法和裝置





