[發(fā)明專利]一種社交網(wǎng)絡用戶虛實映射方法和系統(tǒng)在審
| 申請?zhí)枺?/td> | 201410042782.5 | 申請日: | 2014-01-29 |
| 公開(公告)號: | CN103745014A | 公開(公告)日: | 2014-04-23 |
| 發(fā)明(設計)人: | 梁英;胡開先;許洪波;程學旗;張國清 | 申請(專利權)人: | 中國科學院計算技術研究所 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京泛華偉業(yè)知識產(chǎn)權代理有限公司 11280 | 代理人: | 王勇 |
| 地址: | 100190 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 社交 網(wǎng)絡 用戶 虛實 映射 方法 系統(tǒng) | ||
1.一種社交網(wǎng)絡用戶虛實映射方法,包括:
步驟1)、根據(jù)社交網(wǎng)絡用戶的唯一標識獲取該社交網(wǎng)絡用戶的地理位置信息,并且獲取該地理位置信息對應的地理位置的周邊單位名稱列表;
步驟2)、將所述周邊單位名稱列表中的每個單位名稱與所述社交網(wǎng)絡用戶發(fā)布的消息內(nèi)容進行匹配,根據(jù)匹配程度選擇一個或多個單位名稱。
2.根據(jù)權利要求1所述的方法,其中,步驟1)還包括:
對所述周邊單位名稱列表中的每個單位名稱進行分詞,得到該單位名稱的分詞結(jié)果。
3.根據(jù)權利要求2所述的方法,在步驟2)中,將周邊單位名稱列表中的每個單位名稱與社交網(wǎng)絡用戶發(fā)布的消息內(nèi)容進行匹配包括:
步驟21)、將每個單位名稱的全稱與所述社交網(wǎng)絡用戶發(fā)布的消息內(nèi)容進行匹配,如果匹配成功則使用下式計算該單位名稱的近似度權重:
weight(str)=word.size(str)*factormatchtime(sstr)
其中,str表示單位名稱,weight(str)表示單位名稱的近似度權重,word.size(str)表示單位名稱的長度,factor表示乘數(shù)因子,matchtimes(str)表示單位名稱與消息內(nèi)容的匹配成功次數(shù);
步驟22)、如果匹配不成功,則將該單位名稱的分詞結(jié)果中除該單位名稱的全稱外的每個分詞與所述社交網(wǎng)絡用戶發(fā)布的消息內(nèi)容進行匹配,將每個分詞的匹配成功次數(shù)之和作為該單位名稱的近似度權重。
4.根據(jù)權利要求3所述的方法,其中,步驟2)還包括:
步驟23)、合并近似度權重相同且具有共同的最大前綴的單位名稱,使得所述共同的最大前綴包含在前綴詞庫中或者其長度達到預定長度;其中,合并后的單位名稱為所述共同的最大前綴且其近似度權重為所合并的單位名稱的近似度權重之和,所述前綴詞庫用于存放指示地理位置的前綴詞。
5.根據(jù)權利要求4所述的方法,其中,步驟23)包括:
步驟231)、對于一種近似度權重,新建一棵Trie樹;
步驟232)、將具有該近似度權重的單位名稱插入所述Trie樹,得到具有共同的最大前綴的單位名稱;
步驟233)、如果該共同的最大前綴包含在前綴詞庫中或者其長度達到預定長度,則合并具有該共同的最大前綴且具有該近似度權重的單位名稱;其中,合并后的單位名稱為該共同的最大前綴且其近似度權重為所合并的單位名稱的近似度權重之和,所述前綴詞庫用于存放指示地理位置的前綴詞;
步驟234)、銷毀所述Trie樹;
步驟235)、對于未處理的近似度權重,返回步驟231)進行處理。
6.根據(jù)權利要求4所述的方法,其中,步驟2)還包括:
步驟24)、合并近似度權重不同且單位名稱相同或者互為別名的單位名稱;其中,合并后的單位名稱為所合并的單位名稱中的任何一個,其近似度權重為所合并的單位名稱的近似度權重之和。
7.根據(jù)權利要求3-6中任何一個所述的方法,在步驟2)中,根據(jù)匹配程度選擇一個或多個單位名稱包括:
將單位名稱按照近似度權重進行降序排列,選擇前N個單位名稱并推送;其中N為正整數(shù)。
8.根據(jù)權利要求2-6中任何一個所述的方法,在步驟1)中,對周邊單位名稱列表中的每個單位名稱進行分詞包括:
對所述周邊單位名稱列表中的每個單位名稱進行中文分詞,刪除長度為一個字的分詞;以及
對所述周邊單位名稱列表中的每個單位名稱進行二元組分詞。
9.根據(jù)權利要求2-6中任何一個所述的方法,其中,步驟1)還包括:
如果對單位名稱進行分詞后得到的分詞具有別名,則將該別名加入該單位名稱的分詞結(jié)果。
10.根據(jù)權利要求1所述的方法,其中,步驟1)包括:
步驟11)、根據(jù)社交網(wǎng)絡用戶的唯一標識從社交網(wǎng)絡服務器獲取關于該社交網(wǎng)絡用戶的返回信息,從中得到該社交網(wǎng)絡用戶發(fā)布的消息內(nèi)容和地理位置信息;
步驟12)、根據(jù)所述社交網(wǎng)絡用戶的地理位置信息從社交網(wǎng)絡服務器獲取該地理位置信息對應的地理位置的周邊單位名稱列表。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院計算技術研究所,未經(jīng)中國科學院計算技術研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410042782.5/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 網(wǎng)絡和網(wǎng)絡終端
- 網(wǎng)絡DNA
- 網(wǎng)絡地址自適應系統(tǒng)和方法及應用系統(tǒng)和方法
- 網(wǎng)絡系統(tǒng)及網(wǎng)絡至網(wǎng)絡橋接器
- 一種電力線網(wǎng)絡中根節(jié)點網(wǎng)絡協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡定位方法、存儲介質(zhì)及移動終端
- 網(wǎng)絡裝置、網(wǎng)絡系統(tǒng)、網(wǎng)絡方法以及網(wǎng)絡程序
- 從重復網(wǎng)絡地址自動恢復的方法、網(wǎng)絡設備及其存儲介質(zhì)
- 神經(jīng)網(wǎng)絡的訓練方法、裝置及存儲介質(zhì)
- 網(wǎng)絡管理方法和裝置





