[發(fā)明專利]基于社交內(nèi)容的用戶分組方法在審
| 申請(qǐng)?zhí)枺?/td> | 201510920679.0 | 申請(qǐng)日: | 2015-12-11 |
| 公開(kāi)(公告)號(hào): | CN105512301A | 公開(kāi)(公告)日: | 2016-04-20 |
| 發(fā)明(設(shè)計(jì))人: | 董政;吳文杰;陳露;李學(xué)生 | 申請(qǐng)(專利權(quán))人: | 成都陌云科技有限公司 |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30;G06Q50/00 |
| 代理公司: | 北京天奇智新知識(shí)產(chǎn)權(quán)代理有限公司 11340 | 代理人: | 郭霞 |
| 地址: | 610041 四川省成都市高*** | 國(guó)省代碼: | 四川;51 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 社交 內(nèi)容 用戶 分組 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及大數(shù)據(jù),特別涉及一種基于社交內(nèi)容的用戶分組方法。
背景技術(shù)
隨著移動(dòng)互聯(lián)網(wǎng)的發(fā)展,將生活中的社交關(guān)系遷移到了互聯(lián)網(wǎng)上,帶來(lái)了 信息交換方式的變革,而且改變了傳統(tǒng)的人際溝通方式,對(duì)社會(huì)生活的各個(gè)領(lǐng) 域具有深遠(yuǎn)的意義。用戶之間可以廣泛地溝通、互動(dòng),通過(guò)撰寫(xiě)、中轉(zhuǎn)、收藏 等手段對(duì)文本數(shù)據(jù)進(jìn)行操作。在社交網(wǎng)絡(luò)中,總存在部分節(jié)點(diǎn)連接比較緊密, 而這些節(jié)點(diǎn)同其他節(jié)點(diǎn)之間的聯(lián)系則相對(duì)稀疏,由此可將這部分連接緊密的節(jié) 點(diǎn)歸為同一個(gè)群體。群體作為一種重要的社交關(guān)系屬性,無(wú)形中給輿情控制以 及網(wǎng)絡(luò)監(jiān)管帶來(lái)了巨大的挑戰(zhàn)。如果沒(méi)有對(duì)群體關(guān)系進(jìn)行充分識(shí)別識(shí)別,則無(wú) 法識(shí)別群體興趣,推薦感興趣內(nèi)容,更無(wú)法及時(shí)發(fā)現(xiàn)危害信息,維護(hù)良好的網(wǎng) 絡(luò)環(huán)境。
發(fā)明內(nèi)容
為解決上述現(xiàn)有技術(shù)所存在的問(wèn)題,本發(fā)明提出了一種基于社交內(nèi)容的用 戶分組方法,包括:
對(duì)社交網(wǎng)站服務(wù)器上的用戶信息和社交內(nèi)容進(jìn)行采集,基于所采集的內(nèi)容 來(lái)識(shí)別特定用戶群體。
優(yōu)選地,所述對(duì)社交網(wǎng)站服務(wù)器上的用戶信息和社交內(nèi)容進(jìn)行采集,進(jìn)一 步包括:
通過(guò)數(shù)據(jù)采集系統(tǒng)進(jìn)行數(shù)據(jù)采集,其中采集的數(shù)據(jù)包括用戶信息,其包括 用戶ID、用戶名;文本數(shù)據(jù),其包括會(huì)話ID、會(huì)話文本,以及關(guān)系數(shù)據(jù),包括 關(guān)注列表與關(guān)注者列表;所述數(shù)據(jù)采集系統(tǒng)通過(guò)主控線程進(jìn)行權(quán)限認(rèn)證、程序 初始化、種子節(jié)點(diǎn)讀取、過(guò)濾、數(shù)據(jù)庫(kù)操作;所述數(shù)據(jù)獲取線程借助API開(kāi)放 接口進(jìn)行數(shù)據(jù)采集,采集過(guò)程包括接口請(qǐng)求、json數(shù)據(jù)解析、指針更新,最終返 回給主控線程總數(shù)據(jù)列表;采用二進(jìn)制向量和一系列隨機(jī)映射函數(shù)完成去冗余 計(jì)算;為抓取種子ID列表、用戶ID列表、關(guān)系列表、會(huì)話ID分別添加去冗余 函數(shù),種子列表,抓取用戶列表、社交列表均以其唯一標(biāo)識(shí)ID進(jìn)行,而關(guān)系的 格式將兩個(gè)用戶的ID組合到一起,并通過(guò)前者為被關(guān)注,后者為前者的關(guān)注者 的順序區(qū)分兩者的先后順序;提取種子ID時(shí),多線程對(duì)數(shù)據(jù)庫(kù)的操作添加互斥 鎖;為每個(gè)線程分配抓取任務(wù),為每個(gè)線程令牌資源庫(kù)進(jìn)行區(qū)分式排列組合; 并為每個(gè)線程單獨(dú)設(shè)置一個(gè)斷點(diǎn)文件,記錄抓取的位置;將數(shù)據(jù)庫(kù)連接、關(guān)閉、 查詢、增加、刪除操作進(jìn)行統(tǒng)一管理,抓取對(duì)象的ID首先由人工方式輸入至文 件,每次開(kāi)始抓取任務(wù)之前都加載一遍優(yōu)先級(jí)文件;在分任務(wù)處理中在抓取對(duì) 象上,為每個(gè)線程制定特定的抓取任務(wù),從用戶信息獲取、文本獲取、關(guān)系獲 取中選取的一個(gè)或多個(gè)處理目標(biāo);通過(guò)控制線程的數(shù)量,或調(diào)整API請(qǐng)求后獲 取的數(shù)據(jù)量?jī)煞N方式之一來(lái)從調(diào)節(jié)采集速度;
利用數(shù)據(jù)結(jié)構(gòu)對(duì)會(huì)話過(guò)程進(jìn)行描述;將參與會(huì)話的用戶以關(guān)系連接在一 起,構(gòu)建成基于單個(gè)事件的群體;最后在社交關(guān)系拓?fù)渲胁捎霉?jié)點(diǎn)衡量指標(biāo)識(shí) 別強(qiáng)關(guān)系群體中的節(jié)點(diǎn),最后以樹(shù)形的層級(jí)結(jié)構(gòu)將該事件存儲(chǔ)至文件;其中所 述強(qiáng)關(guān)系群體具體定義為,如果已知群體α滿足:對(duì)于群體α內(nèi)的每個(gè)用戶節(jié)點(diǎn)i, 均滿足i與群體α內(nèi)節(jié)點(diǎn)構(gòu)成的節(jié)點(diǎn)數(shù)量大于該節(jié)點(diǎn)與群體α外節(jié)點(diǎn)構(gòu)成的節(jié)點(diǎn) 數(shù)量,則群體α被稱為強(qiáng)關(guān)系群體。
本發(fā)明相比現(xiàn)有技術(shù),具有以下優(yōu)點(diǎn):
本發(fā)明提出了一種基于社交內(nèi)容的用戶分組方法,有效提高互聯(lián)網(wǎng)社交組 群的識(shí)別準(zhǔn)確率和時(shí)效性。
附圖說(shuō)明
圖1是根據(jù)本發(fā)明實(shí)施例的基于社交內(nèi)容的用戶分組方法的流程圖。
具體實(shí)施方式
下文與圖示本發(fā)明原理的附圖一起提供對(duì)本發(fā)明一個(gè)或者多個(gè)實(shí)施例的詳 細(xì)描述。結(jié)合這樣的實(shí)施例描述本發(fā)明,但是本發(fā)明不限于任何實(shí)施例。本發(fā) 明的范圍僅由權(quán)利要求書(shū)限定,并且本發(fā)明涵蓋諸多替代、修改和等同物。在 下文描述中闡述諸多具體細(xì)節(jié)以便提供對(duì)本發(fā)明的透徹理解。出于示例的目的 而提供這些細(xì)節(jié),并且無(wú)這些具體細(xì)節(jié)中的一些或者所有細(xì)節(jié)也可以根據(jù)權(quán)利 要求書(shū)實(shí)現(xiàn)本發(fā)明。
本發(fā)明的一方面提供了一種基于社交內(nèi)容的用戶分組方法。圖1是根據(jù)本 發(fā)明實(shí)施例的基于社交內(nèi)容的用戶分組方法流程圖。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于成都陌云科技有限公司,未經(jīng)成都陌云科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510920679.0/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 社交網(wǎng)絡(luò)裝置成員資格和應(yīng)用
- 一種社交對(duì)象搜索方法及裝置
- 針對(duì)嵌入式應(yīng)用上下文中的搜索的查詢意圖表達(dá)
- 一種關(guān)鍵社交信息的確定方法及裝置
- 社交網(wǎng)絡(luò)數(shù)據(jù)的可視化方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 動(dòng)態(tài)社交圈確定方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 控制社交分享信息在社交空間的呈現(xiàn)狀態(tài)的方法與設(shè)備
- 社交角色管理方法、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 基于社交關(guān)系的社交屬性數(shù)據(jù)確定方法、裝置及設(shè)備
- 一種社交賬戶推薦方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 內(nèi)容再現(xiàn)系統(tǒng)、內(nèi)容提供方法、內(nèi)容再現(xiàn)裝置、內(nèi)容提供裝置、內(nèi)容再現(xiàn)程序和內(nèi)容提供程序
- 內(nèi)容記錄系統(tǒng)、內(nèi)容記錄方法、內(nèi)容記錄設(shè)備和內(nèi)容接收設(shè)備
- 內(nèi)容服務(wù)系統(tǒng)、內(nèi)容服務(wù)器、內(nèi)容終端及內(nèi)容服務(wù)方法
- 內(nèi)容分發(fā)系統(tǒng)、內(nèi)容分發(fā)裝置、內(nèi)容再生終端及內(nèi)容分發(fā)方法
- 內(nèi)容發(fā)布、內(nèi)容獲取的方法、內(nèi)容發(fā)布裝置及內(nèi)容傳播系統(tǒng)
- 內(nèi)容提供裝置、內(nèi)容提供方法、內(nèi)容再現(xiàn)裝置、內(nèi)容再現(xiàn)方法
- 內(nèi)容傳輸設(shè)備、內(nèi)容傳輸方法、內(nèi)容再現(xiàn)設(shè)備、內(nèi)容再現(xiàn)方法、程序及內(nèi)容分發(fā)系統(tǒng)
- 內(nèi)容發(fā)送設(shè)備、內(nèi)容發(fā)送方法、內(nèi)容再現(xiàn)設(shè)備、內(nèi)容再現(xiàn)方法、程序及內(nèi)容分發(fā)系統(tǒng)
- 內(nèi)容再現(xiàn)裝置、內(nèi)容再現(xiàn)方法、內(nèi)容再現(xiàn)程序及內(nèi)容提供系統(tǒng)
- 內(nèi)容記錄裝置、內(nèi)容編輯裝置、內(nèi)容再生裝置、內(nèi)容記錄方法、內(nèi)容編輯方法、以及內(nèi)容再生方法





