[發(fā)明專(zhuān)利]基于word2Vec的社團(tuán)構(gòu)建方法、裝置及計(jì)算機(jī)處理設(shè)備在審
| 申請(qǐng)?zhí)枺?/td> | 201710515571.2 | 申請(qǐng)日: | 2017-06-29 |
| 公開(kāi)(公告)號(hào): | CN107392782A | 公開(kāi)(公告)日: | 2017-11-24 |
| 發(fā)明(設(shè)計(jì))人: | 彭恩偉 | 申請(qǐng)(專(zhuān)利權(quán))人: | 上海斐訊數(shù)據(jù)通信技術(shù)有限公司 |
| 主分類(lèi)號(hào): | G06Q50/00 | 分類(lèi)號(hào): | G06Q50/00;G06F17/30 |
| 代理公司: | 上海碩力知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙)31251 | 代理人: | 郭桂峰 |
| 地址: | 201616 *** | 國(guó)省代碼: | 上海;31 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 word2vec 社團(tuán) 構(gòu)建 方法 裝置 計(jì)算機(jī) 處理 設(shè)備 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及社團(tuán)劃分領(lǐng)域,特別是涉及一種基于word2Vec的社團(tuán)構(gòu)建方法、裝置及一種計(jì)算機(jī)處理設(shè)備。
背景技術(shù)
隨著社交網(wǎng)絡(luò)的快速發(fā)展,網(wǎng)友花費(fèi)在社交網(wǎng)絡(luò)的時(shí)間越來(lái)越多,同時(shí)也對(duì)社交網(wǎng)絡(luò)的依賴(lài)也越來(lái)越強(qiáng)。社交網(wǎng)絡(luò)在巨多用戶(hù)支持的背景下,怎么留的住用戶(hù),怎么基于這些用戶(hù)提供更好服務(wù)的同時(shí)發(fā)掘更多的商機(jī),已經(jīng)成為了現(xiàn)如今各大社交網(wǎng)絡(luò)亟待解決并會(huì)一直面對(duì)的問(wèn)題。其中社交網(wǎng)絡(luò)中團(tuán)體的劃分儼然成為了學(xué)術(shù)界和工業(yè)界廣泛關(guān)注的對(duì)象。所謂社交網(wǎng)絡(luò)中的團(tuán)體是指在社交網(wǎng)絡(luò)中的多個(gè)個(gè)體兩兩之間存在關(guān)系的一個(gè)最大集合,也稱(chēng)其為社團(tuán)(community),通過(guò)興趣以及用戶(hù)的關(guān)系將用戶(hù)劃分到指定的社團(tuán),然后根據(jù)相應(yīng)社團(tuán)的屬性對(duì)該社團(tuán)推薦該社團(tuán)感興趣的活動(dòng)。
如今劃分團(tuán)體主流的方法是基于社交網(wǎng)絡(luò)中的人物關(guān)系運(yùn)用圖論中的相關(guān)方法找到其中的密集的節(jié)點(diǎn)集合,然后基于該節(jié)點(diǎn)集合以及用戶(hù)的興趣標(biāo)簽發(fā)現(xiàn)他們中大多數(shù)人感興趣的活動(dòng),將該節(jié)點(diǎn)集合命名為該活動(dòng)興趣小組。但該方法存在許多不足,比如對(duì)整個(gè)人物關(guān)系圖,直接按照人物關(guān)系劃分,由于人物關(guān)系圖相對(duì)于這個(gè)社交網(wǎng)絡(luò)關(guān)系圖是一個(gè)極小的子集,因此在劃分代價(jià)上較大,不利于分布式的解決方案;由于興趣組的劃分是基于tag而用戶(hù)的興趣各不相同,那么用戶(hù)的興趣向量會(huì)非常稀疏;由于初始是基于人物關(guān)系圖劃分,因此在考慮到團(tuán)體劃分時(shí)并沒(méi)有較好的處理一個(gè)人基于興趣可能存在于多個(gè)團(tuán)體當(dāng)中,也就是圖論中的重疊問(wèn)題處理較差等等。
發(fā)明內(nèi)容
本發(fā)明主要解決的技術(shù)問(wèn)題是提供一種基于word2Vec的社團(tuán)構(gòu)建方法、裝置及一種計(jì)算機(jī)處理設(shè)備,能夠把社交網(wǎng)絡(luò)中的用戶(hù)節(jié)點(diǎn)映射到更稠密的向量空間中,從而表示節(jié)點(diǎn)與節(jié)點(diǎn)之間的潛在聯(lián)系,能夠更好的挖掘節(jié)點(diǎn)與節(jié)點(diǎn)之間的關(guān)系,劃分出完善的社交社團(tuán)。
為解決技術(shù)問(wèn)題,本發(fā)明采用的一個(gè)技術(shù)方案是:提供一種基于word2Vec的社團(tuán)構(gòu)建方法,該方法的步驟包括:統(tǒng)計(jì)社交網(wǎng)絡(luò)中的所有用戶(hù)節(jié)點(diǎn),及不同用戶(hù)節(jié)點(diǎn)之間的社交關(guān)聯(lián)關(guān)系;以社交網(wǎng)絡(luò)的任一用戶(hù)節(jié)點(diǎn)為起點(diǎn),根據(jù)不同用戶(hù)節(jié)點(diǎn)間的社交關(guān)聯(lián)關(guān)系,以設(shè)定的跳數(shù)進(jìn)行隨機(jī)游走,得到由用戶(hù)節(jié)點(diǎn)組成的多個(gè)第一節(jié)點(diǎn)序列;設(shè)置一指定長(zhǎng)度的滑動(dòng)窗口,對(duì)每一第一節(jié)點(diǎn)序列進(jìn)行截取操作,得到長(zhǎng)度等于指定長(zhǎng)度的多個(gè)第二節(jié)點(diǎn)序列;將第二節(jié)點(diǎn)序列輸入到word2Vec模型進(jìn)行訓(xùn)練,得到社交網(wǎng)絡(luò)中每一用戶(hù)節(jié)點(diǎn)的矩陣表示;根據(jù)用戶(hù)節(jié)點(diǎn)矩陣,計(jì)算每?jī)蓚€(gè)用戶(hù)節(jié)點(diǎn)之間的相似度,以對(duì)用戶(hù)節(jié)點(diǎn)劃分社團(tuán)。
為解決技術(shù)問(wèn)題,本發(fā)明采用的一個(gè)技術(shù)方案是:提供一種計(jì)算機(jī)處理設(shè)備,包括處理器及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),處理器獲取計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上的計(jì)算機(jī)程序,并執(zhí)行前述技術(shù)方案的步驟。
為解決技術(shù)問(wèn)題,本發(fā)明采用的一個(gè)技術(shù)方案是:提供一種基于word2Vec的社團(tuán)構(gòu)建裝置,包括:統(tǒng)計(jì)模塊,用于執(zhí)行統(tǒng)計(jì)社交網(wǎng)絡(luò)中的所有用戶(hù)節(jié)點(diǎn),及不同用戶(hù)節(jié)點(diǎn)之間的社交關(guān)聯(lián)關(guān)系的步驟;第一節(jié)點(diǎn)序列生成模塊,用于執(zhí)行以社交網(wǎng)絡(luò)的任一用戶(hù)節(jié)點(diǎn)為起點(diǎn),根據(jù)不同用戶(hù)節(jié)點(diǎn)間的社交關(guān)聯(lián)關(guān)系,以設(shè)定的跳數(shù)進(jìn)行隨機(jī)游走,得到由用戶(hù)節(jié)點(diǎn)組成的多個(gè)第一節(jié)點(diǎn)序列的步驟;第二節(jié)點(diǎn)序列生成模塊,用于執(zhí)行設(shè)置一指定長(zhǎng)度的滑動(dòng)窗口,對(duì)每一第一節(jié)點(diǎn)序列進(jìn)行截取操作,得到長(zhǎng)度等于指定長(zhǎng)度的多個(gè)第二節(jié)點(diǎn)序列的步驟;訓(xùn)練模塊,用于執(zhí)行將第二節(jié)點(diǎn)序列輸入到word2Vec模型進(jìn)行訓(xùn)練,得到社交網(wǎng)絡(luò)中每一用戶(hù)節(jié)點(diǎn)的矩陣表示的步驟;社團(tuán)劃分模塊,用于執(zhí)行根據(jù)用戶(hù)節(jié)點(diǎn)矩陣,計(jì)算每?jī)蓚€(gè)用戶(hù)節(jié)點(diǎn)之間的相似度,以對(duì)用戶(hù)節(jié)點(diǎn)劃分社團(tuán)的步驟。
區(qū)別于現(xiàn)有技術(shù),本發(fā)明的基于word2Vec的社團(tuán)構(gòu)建方法的步驟包括:統(tǒng)計(jì)社交網(wǎng)絡(luò)中的所有用戶(hù)節(jié)點(diǎn),及不同用戶(hù)節(jié)點(diǎn)之間的社交關(guān)聯(lián)關(guān)系;以社交網(wǎng)絡(luò)的任一用戶(hù)節(jié)點(diǎn)為起點(diǎn),根據(jù)不同用戶(hù)節(jié)點(diǎn)間的社交關(guān)聯(lián)關(guān)系,以設(shè)定的跳數(shù)進(jìn)行隨機(jī)游走,得到由用戶(hù)節(jié)點(diǎn)組成的多個(gè)第一節(jié)點(diǎn)序列;設(shè)置一指定長(zhǎng)度的滑動(dòng)窗口,對(duì)每一第一節(jié)點(diǎn)序列進(jìn)行截取操作,得到長(zhǎng)度等于指定長(zhǎng)度的多個(gè)第二節(jié)點(diǎn)序列;將第二節(jié)點(diǎn)序列輸入到word2Vec模型進(jìn)行訓(xùn)練,得到社交網(wǎng)絡(luò)中每一用戶(hù)節(jié)點(diǎn)的矩陣表示;根據(jù)用戶(hù)節(jié)點(diǎn)矩陣,計(jì)算每?jī)蓚€(gè)用戶(hù)節(jié)點(diǎn)之間的相似度,以對(duì)用戶(hù)節(jié)點(diǎn)劃分社團(tuán)。通過(guò)本發(fā)明,能夠把社交網(wǎng)絡(luò)中的用戶(hù)節(jié)點(diǎn)映射到更稠密的向量空間中,從而表示節(jié)點(diǎn)與節(jié)點(diǎn)之間的潛在聯(lián)系,能夠更好的挖掘節(jié)點(diǎn)與節(jié)點(diǎn)之間的關(guān)系,劃分出完善的社交社團(tuán)。
附圖說(shuō)明
圖1是本發(fā)明提供的一種基于word2Vec的社團(tuán)構(gòu)建方法中涉及的簡(jiǎn)單社交網(wǎng)絡(luò)的示意圖;
圖2是本發(fā)明提供的一種基于word2Vec的社團(tuán)構(gòu)建方法的流程示意圖。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于上海斐訊數(shù)據(jù)通信技術(shù)有限公司,未經(jīng)上海斐訊數(shù)據(jù)通信技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710515571.2/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 上一篇:用戶(hù)關(guān)系的識(shí)別方法、對(duì)象關(guān)系的識(shí)別方法及裝置
- 下一篇:種植參數(shù)調(diào)控方法和種植參數(shù)調(diào)控裝置
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06Q 專(zhuān)門(mén)適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測(cè)目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類(lèi)目不包含的專(zhuān)門(mén)適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測(cè)目的的處理系統(tǒng)或方法
G06Q50-00 專(zhuān)門(mén)適用于特定經(jīng)營(yíng)部門(mén)的系統(tǒng)或方法,例如公用事業(yè)或旅游
G06Q50-02 .農(nóng)業(yè);漁業(yè);礦業(yè)
G06Q50-04 .制造業(yè)
G06Q50-06 .電力、天然氣或水供應(yīng)
G06Q50-08 .建筑
G06Q50-10 .服務(wù)
- 一種基于word2vec?LDA模型的文本主題詞提取方法
- 一種基于數(shù)據(jù)特征降維編碼的流媒體內(nèi)容分發(fā)方法
- 一種基于用戶(hù)行為序列的個(gè)性化推薦系統(tǒng)召回方法、系統(tǒng)、裝置及存儲(chǔ)介質(zhì)
- 一種基于用戶(hù)行為序列和數(shù)據(jù)融合的推薦系統(tǒng)召回方法及系統(tǒng)
- 動(dòng)態(tài)調(diào)整Word2Vec模型詞典的方法、裝置、介質(zhì)及電子設(shè)備
- 一種基于Word2Vec模型的WordNet中詞語(yǔ)相似度計(jì)算方法
- 一種基于word2vec技術(shù)的相似度比較方法及裝置
- 一種自動(dòng)發(fā)現(xiàn)音頻關(guān)鍵詞到分類(lèi)映射關(guān)系的方法
- 一種面向模板基于Word2vec的日志異常檢測(cè)方法及裝置
- 一種word2vec模型訓(xùn)練、數(shù)據(jù)召回方法及裝置
- 基于重疊點(diǎn)識(shí)別的網(wǎng)絡(luò)重疊社團(tuán)檢測(cè)方法
- 一種基于動(dòng)態(tài)社團(tuán)識(shí)別的社交網(wǎng)絡(luò)交友推薦方法及系統(tǒng)
- 基于邊零模型的網(wǎng)絡(luò)邊社團(tuán)發(fā)現(xiàn)方法
- 一種基于APP的高校社團(tuán)管理系統(tǒng)
- 多網(wǎng)絡(luò)社群管理系統(tǒng)及其管理方法
- 一種基于節(jié)點(diǎn)表示的主題社團(tuán)發(fā)現(xiàn)方法
- 一種基于社會(huì)網(wǎng)絡(luò)結(jié)構(gòu)分析社團(tuán)數(shù)據(jù)挖掘方法
- 一種Spark云服務(wù)環(huán)境下面的復(fù)雜網(wǎng)絡(luò)社團(tuán)發(fā)現(xiàn)方法
- 一種供需網(wǎng)絡(luò)社團(tuán)結(jié)構(gòu)挖掘方法
- 一種基于前后端分離式架構(gòu)的社團(tuán)管理系統(tǒng)
- 構(gòu)建墊、實(shí)體圖像構(gòu)建物和構(gòu)建構(gòu)建物支撐件的方法
- 支持松耦合的軟件構(gòu)建方法、系統(tǒng)及該系統(tǒng)的實(shí)現(xiàn)方法
- 版本的構(gòu)建系統(tǒng)及方法
- 工程構(gòu)建系統(tǒng)及其構(gòu)建方法
- 實(shí)例構(gòu)建方法、裝置及軟件系統(tǒng)
- 軟件構(gòu)建方法、軟件構(gòu)建裝置和軟件構(gòu)建系統(tǒng)
- 天花板地圖構(gòu)建方法、構(gòu)建裝置以及構(gòu)建程序
- 一種項(xiàng)目構(gòu)建方法、持續(xù)集成系統(tǒng)及終端設(shè)備
- 并行構(gòu)建的方法、裝置及設(shè)備
- 構(gòu)建肺癌預(yù)測(cè)模型構(gòu)建方法





