[發明專利]用于網絡消息通信的聯系人語義分組方法有效
| 申請號: | 201110346312.4 | 申請日: | 2011-11-04 |
| 公開(公告)號: | CN102347917A | 公開(公告)日: | 2012-02-08 |
| 發明(設計)人: | 黃健斌;孫鶴立;李偉;吳志殿;慕鵬;趙貝貝;雷倩 | 申請(專利權)人: | 西安電子科技大學 |
| 主分類號: | H04L12/58 | 分類號: | H04L12/58;H04L12/24;G06F17/30 |
| 代理公司: | 陜西電子工業專利中心 61205 | 代理人: | 王品華;朱紅星 |
| 地址: | 710071*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 網絡 消息 通信 聯系人 語義 分組 方法 | ||
技術領域
本發明屬于網絡通信技術領域,涉及網絡用戶通信數據和行為分析技術,具體是一種用于網絡消息通信的聯系人語義分組方法。針對網絡郵件、手機通話、即時消息通信、社交網絡等網絡消息通信系統,提供用戶聯系人的自動分組管理支持。
背景技術
隨著信息時代的到來,當前許多領域都面臨著對海量數據的處理,而如何在海量的數據中提取有用的信息已成為當前研究的主要方向。尤其隨著個人的通訊方式越來越多,其歷史通信數據廣泛存在于手機、電子郵箱、即時消息、飛信、社交網絡等網絡通信系統的客戶端上,并且個人在社會的角色是多樣的,人與人之間的交互導致了嵌套和重疊的語義群組結構的產生,嵌套群組結構可以展現用戶好友社會關系的不同層次,這些在現實生活中很常見,例如:一個用戶的同學群組又可分為高中同學、大學同學和研究生同學等子群組。重疊群組則允許一個聯系人可以屬于多個群組,這也是合理的。例如:一個用戶的某個同學可能又是他目前的同事,這些都使個人的歷史通信數據變的復雜而海量,在學術領域這類數據通常都可以建模為包含實體和實體之間關系的圖。因此如何從圖數據中發現有意義的聯系人語義分組是一個具有挑戰性的問題,具有重要的理論意義和實用價值。
現在學術界針對聯系人語義分組這個問題已經有了很深入的研究,提出了很多相關的方法。在數據挖掘領域已經提出了很多分組聚類方法,例如:基于層次的聚類、密度聚類、網格聚類等。基于層次的聚類方法是對給定的數據集進行層次的分解,直到某種條件滿足為止;密度聚類是只要一個區域中的點的密度大過某個閾值,就把它加到與之相近的聚類中;網格聚類是采用多維網格數據結構,將空間劃分為優先數目的單元,以構成一個可以進行聚類分析的網絡結構。而這些傳統的圖聚類方法通常針對大規模數據集,采用全局化的批量數據處理方法,導致其效率較低,運行時間較長和存儲空間開銷較大,對于單個用戶的歷史消息通信數據,其所處理得到的聯系人語義分組難以滿足現實要求。
發明內容
本發明的目的在于針對上述已有技術的不足,提出一種用于網絡消息通信的聯系人語義分組方法,以減小聯系人語義分組的運行時間和存儲空間開銷,使消息通信系統更便利和人性化,滿足用戶的現實要求。
實現本發明的技術思路是:通過對用戶局部通信鏈接圖數據進行分析,構建由語義群組構成的拓撲關系,然后對拓撲關系用Jaccard系數進行合并,實現消息通信的聯系人語義分組。具體步驟包括如下:
(A)構建用戶消息通信社會關系圖,即在用戶的一次通信記錄中,先將用戶自身看作是一個節點u,然后將其余所有聯系人的集合看作是另一個節點l,在用戶節點u和聯系人節點l之間建立一條邊,以此方式遍歷所有通信數據,得到用戶的消息通信社會關系圖;
(B)構建由語義群組構成的拓撲關系T:
B1)初始化拓撲關系T,在用戶消息通信社會關系圖中,抽取出那些與用戶節點u通信相對頻繁的節點作為語義群組,即一個通信記錄的聯系人的數目大于等于最小組規模時,將聯系人集合所構成的節點作為一個語義群組加入到拓撲關系T中;
B2)生成候選語義群組的最大子集,即如果任意兩個語義群組的交集也滿足最小組規模時,則將其交集也加入到T中,直到沒有新的群組加入為止;
B3)去除無意義的群組,即將用戶節點u與語義群組g交互的消息個數小于最小消息計數閾值的的候選語義群組移除;
B4)將不相關的語義群組合并,即通過計算語義群組間共享差serr進行識別歸入,將拓撲關系T中的語義群組按照規模大小進行降序排序,迭代地遍歷語義群組集合,移除那些可被更大規模群組代替的語義群組;
(C)構建層次化的語義群組:
C1)對步驟B4)階段產生的語義群組,計算任意兩個語義群組g1和g2間的Jaccard系數,是語義群組g1和g2具有的相同聯系人構成的集合
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安電子科技大學,未經西安電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110346312.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:圖像形成裝置及其圖像形成方法
- 下一篇:可視牙刷





