[發(fā)明專利]一種預(yù)測(cè)社交網(wǎng)絡(luò)用戶屬性的方法有效
| 申請(qǐng)?zhí)枺?/td> | 201710475429.X | 申請(qǐng)日: | 2017-06-21 |
| 公開(公告)號(hào): | CN107368534B | 公開(公告)日: | 2020-06-12 |
| 發(fā)明(設(shè)計(jì))人: | 王夢(mèng)伊;陳志;岳文靜;劉亞威 | 申請(qǐng)(專利權(quán))人: | 南京郵電大學(xué) |
| 主分類號(hào): | G06F16/35 | 分類號(hào): | G06F16/35;G06F16/901;G06Q50/00 |
| 代理公司: | 南京經(jīng)緯專利商標(biāo)代理有限公司 32200 | 代理人: | 葉連生 |
| 地址: | 210023 江*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 預(yù)測(cè) 社交 網(wǎng)絡(luò) 用戶 屬性 方法 | ||
1.一種預(yù)測(cè)社交網(wǎng)絡(luò)用戶屬性的方法,其特征在于:包括以下步驟:
步驟1)采集社交網(wǎng)絡(luò)信息數(shù)據(jù),并對(duì)數(shù)據(jù)進(jìn)行清洗,獲得社交網(wǎng)絡(luò)清洗后的數(shù)據(jù),具體步驟如下:
步驟11)將同一用戶的屬性封裝成一個(gè)類,將值為字符串的,每個(gè)字符串分配一個(gè)唯一的數(shù)字ID,將包含地點(diǎn)的轉(zhuǎn)化為經(jīng)緯度表示;
步驟12)去除不具備分類能力的屬性;
步驟13)將屬性少于60個(gè)的用戶刪除,選擇一個(gè)用戶的屬性有多個(gè)值的,提取排在其最前面的值;
步驟2)定義社交網(wǎng)絡(luò)圖模型,具體步驟如下:
步驟21)定義社交網(wǎng)絡(luò)圖G=(V,E),其中,V為節(jié)點(diǎn),表示用戶;E為邊,表示用戶間的關(guān)系;
步驟22)對(duì)于表示用戶i的節(jié)點(diǎn)vi,vi∈V,i={1,2,3....,n},用一個(gè)向量Ai表示用戶i的屬性,其中,n為用戶的數(shù)量,m為用戶i的屬性數(shù),為用戶i的第j個(gè)屬性;
步驟23)定義Dc為標(biāo)記過的數(shù)據(jù)集,定義Lc為標(biāo)記過的數(shù)據(jù)集Dc對(duì)應(yīng)的標(biāo)簽集,其中,Dc=(d1,d2,...,dl),di∈D,i∈(1,2,...,l),Lc=(L1,L2,...,Ll),Li∈τ,i∈(1,2,...,l),D為數(shù)據(jù)集,τ為標(biāo)簽集,l為標(biāo)記過的標(biāo)簽集;
步驟24)定義Du為未標(biāo)記過的數(shù)據(jù)集,定義Lu為未標(biāo)記過的標(biāo)簽集,其中,Du=(d1+l,d2+l,...,dq),Lu=(L1+l,L2+l,...,Lq),q為標(biāo)簽的數(shù)量;
步驟3)對(duì)數(shù)據(jù)進(jìn)行分析,具體步驟如下:
步驟31)計(jì)算用戶屬性相同時(shí)成為朋友的概率Sa,其中,ai,ak∈A,i,k∈(1,2,...,n),A為所有用戶的屬性的集和;E為用戶間關(guān)系的集合,s.t.表示受約束于,是subject to的縮寫;
步驟32)計(jì)算屬性值相同時(shí)成為朋友的經(jīng)驗(yàn)概率Pa,其中,Ti為在屬性a中,值為第i個(gè)值的個(gè)數(shù),k為屬性a的值的個(gè)數(shù),a∈A;
步驟33)計(jì)算屬性的密切度Ca,所述其中,Sa為用戶屬性相同時(shí)為朋友的概率,Pa為屬性值相同時(shí)成為朋友的經(jīng)驗(yàn)概率;
步驟4)對(duì)數(shù)據(jù)進(jìn)行特征提取,具體步驟如下:
步驟41)計(jì)算數(shù)據(jù)的信息熵Entropy(S)、信息增益Gain(S,a)、分裂情況Split(S,a)和增益比GainRatio(S,a),通過這些評(píng)價(jià)值,來選取需要的特征和需要預(yù)測(cè)的特征,
其中,
其中,M為屬性集合的大小;Si為與用戶i屬性相同時(shí)為朋友的預(yù)測(cè)結(jié)果,Pi為屬性值的第i個(gè)相同時(shí)成為朋友的經(jīng)驗(yàn)概率Pi,S為預(yù)測(cè)結(jié)果;|Qx|為屬性的值為x的用戶成為朋友的概率;
步驟42)選取增益比的值最大的三個(gè)屬性作為用來預(yù)測(cè)的訓(xùn)練屬性;
步驟5)采用局部全局一致性算法預(yù)測(cè)隱藏屬性,具體步驟如下:
步驟51)對(duì)于每個(gè)Vi,Vj∈V,i,j={1,2,...,n},計(jì)算相似度d(i,j),其中,為屬性相似度,為組相似度,為關(guān)系相似度,Ai和Aj為用戶i和j的屬性集,為Ai的逆矩陣,Gi和Gj為用戶i和j所在的組,r為用戶i和j建立聯(lián)系所經(jīng)過的用戶數(shù);
步驟52)初始化相似-矩陣W為0,對(duì)于所有i,j=(1,2,...,n),如果i不等于j,計(jì)算wij,當(dāng)vi,vj∈V且Li=Lj,i,j={1,2,...,l}時(shí),wij=0;當(dāng)vi,vj∈V且Li≠Lj,i,j={1,2,...l}時(shí),wij=1;其他情況Li和Lj分別為用戶i和j的標(biāo)簽,vi和vj便是用戶i和j的節(jié)點(diǎn),d(i,j)為用戶i和j的相似度,σ為相似度的平均值,n為用戶的個(gè)數(shù);
步驟53)初始化對(duì)角矩陣D,計(jì)算預(yù)測(cè)結(jié)果S,
步驟54)初始化初始化迭代次數(shù)t=0,選擇α∈[0,1),l為標(biāo)記過的標(biāo)簽集;
步驟55)計(jì)算第t+1次迭代S是預(yù)測(cè)結(jié)果,t為迭代次數(shù);
步驟56)判斷是否收斂,如果收斂,結(jié)束循環(huán),否則,t=t+1,執(zhí)行步驟55);
步驟6)獲得預(yù)測(cè)結(jié)果,步驟如下:
步驟61)獲得預(yù)測(cè)結(jié)果S,其中n為用戶的數(shù)量,τ為標(biāo)簽集,l為標(biāo)記過的標(biāo)簽集,si∈S;
步驟62)將得到的集合S添加到最終解空間Solution,集合S是預(yù)測(cè)結(jié)果。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京郵電大學(xué),未經(jīng)南京郵電大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710475429.X/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法、程序以及記錄介質(zhì)
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 基于時(shí)間序列預(yù)測(cè)模型適用性量化的預(yù)測(cè)模型選擇方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 分類預(yù)測(cè)方法及裝置、預(yù)測(cè)模型訓(xùn)練方法及裝置
- 幀內(nèi)預(yù)測(cè)的方法及裝置
- 圖像預(yù)測(cè)方法及裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 文本預(yù)測(cè)方法、裝置以及電子設(shè)備
- 模型融合方法、預(yù)測(cè)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 社交網(wǎng)絡(luò)裝置成員資格和應(yīng)用
- 一種社交對(duì)象搜索方法及裝置
- 針對(duì)嵌入式應(yīng)用上下文中的搜索的查詢意圖表達(dá)
- 一種關(guān)鍵社交信息的確定方法及裝置
- 社交網(wǎng)絡(luò)數(shù)據(jù)的可視化方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 動(dòng)態(tài)社交圈確定方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 控制社交分享信息在社交空間的呈現(xiàn)狀態(tài)的方法與設(shè)備
- 社交角色管理方法、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 基于社交關(guān)系的社交屬性數(shù)據(jù)確定方法、裝置及設(shè)備
- 一種社交賬戶推薦方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 網(wǎng)絡(luò)和網(wǎng)絡(luò)終端
- 網(wǎng)絡(luò)DNA
- 網(wǎng)絡(luò)地址自適應(yīng)系統(tǒng)和方法及應(yīng)用系統(tǒng)和方法
- 網(wǎng)絡(luò)系統(tǒng)及網(wǎng)絡(luò)至網(wǎng)絡(luò)橋接器
- 一種電力線網(wǎng)絡(luò)中根節(jié)點(diǎn)網(wǎng)絡(luò)協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡(luò)定位方法、存儲(chǔ)介質(zhì)及移動(dòng)終端
- 網(wǎng)絡(luò)裝置、網(wǎng)絡(luò)系統(tǒng)、網(wǎng)絡(luò)方法以及網(wǎng)絡(luò)程序
- 從重復(fù)網(wǎng)絡(luò)地址自動(dòng)恢復(fù)的方法、網(wǎng)絡(luò)設(shè)備及其存儲(chǔ)介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、裝置及存儲(chǔ)介質(zhì)
- 網(wǎng)絡(luò)管理方法和裝置





