[發(fā)明專利]一種基于因子圖模型的社交網(wǎng)絡(luò)多任務(wù)預(yù)測方法在審
| 申請?zhí)枺?/td> | 201710770816.6 | 申請日: | 2017-08-31 |
| 公開(公告)號: | CN107451703A | 公開(公告)日: | 2017-12-08 |
| 發(fā)明(設(shè)計)人: | 張子柯;林松;劉闖 | 申請(專利權(quán))人: | 杭州師范大學(xué) |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06Q10/06;G06Q30/02;G06Q30/06;G06Q50/00;G06F17/30 |
| 代理公司: | 杭州天正專利事務(wù)所有限公司33201 | 代理人: | 王兵,黃美娟 |
| 地址: | 311121 浙江省杭州*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 因子 模型 社交 網(wǎng)絡(luò) 任務(wù) 預(yù)測 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及機器學(xué)習(xí)方法,因子圖模型,個性化推薦技術(shù)和網(wǎng)絡(luò)遷移結(jié)構(gòu) 構(gòu)建技術(shù),適用于解決異質(zhì)網(wǎng)絡(luò)中多任務(wù)鏈接預(yù)測問題。
背景技術(shù)
隨著互聯(lián)網(wǎng)技術(shù)的進步和在線社交網(wǎng)絡(luò)的普及,網(wǎng)絡(luò)規(guī)模不斷擴大,人們 所面臨的網(wǎng)絡(luò)也從簡單的人際關(guān)系網(wǎng)絡(luò)向耦合社交網(wǎng)絡(luò)過渡。耦合社交網(wǎng)絡(luò)通 常具有復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu),包含多類型的節(jié)點(比如用戶和商品)和多種類型的 邊(比如社交鏈接和評分鏈接)。傳統(tǒng)的耦合社交網(wǎng)絡(luò)中的鏈路預(yù)測研究主要集 中在社交鏈路預(yù)測或者評分鏈路預(yù)測,通常認為不同類型的鏈路預(yù)測任務(wù)之間 是相互獨立的。然而在真實世界中的網(wǎng)絡(luò),這兩種預(yù)測往往是相關(guān)的,比如, 如果兩個人是朋友則他們更有可能購買或評價相同的商品,同樣的,如果兩個 人經(jīng)常購買或評價同樣的商品,則他們更有可能具有相似的興趣和愛好,而有 更大概率成為朋友。因此,如何通過構(gòu)建網(wǎng)絡(luò)遷移結(jié)構(gòu),結(jié)合因子圖模型,使 多種預(yù)測任務(wù)通過信息流動產(chǎn)生關(guān)聯(lián),對復(fù)雜網(wǎng)絡(luò)中的異質(zhì)鏈路預(yù)測研究有著 極重要的理論和實際意義。
現(xiàn)有鏈路預(yù)測思路是先計算網(wǎng)絡(luò)節(jié)點特征,比如入度、出度、聚類系數(shù)等; 網(wǎng)絡(luò)拓撲結(jié)構(gòu)特征,比如共同鄰居指標(biāo)、AA指標(biāo)、Salton指標(biāo)、Jaccard指標(biāo)、 HPI指標(biāo)等,然后把多種特征集成在一起公式中r代表集成的結(jié)果, xi代表提取的第i個特征,wi代表第i個特征的權(quán)重,最后帶入到已有的機器學(xué) 習(xí)模型中,通過訓(xùn)練得到權(quán)重向量w。
然而,由于社交鏈路預(yù)測和評分鏈路預(yù)測網(wǎng)絡(luò)結(jié)構(gòu)的不同,提取的特征也不同, 因此需要學(xué)習(xí)多個模型。現(xiàn)在的因子圖模型在鏈路預(yù)測技術(shù)的應(yīng)用時認為社交 網(wǎng)絡(luò)中多種預(yù)測任務(wù)之間的是獨立的,做多種預(yù)測需要訓(xùn)練不同的模型,目前 還沒有通過挖掘網(wǎng)絡(luò)遷移結(jié)構(gòu)來做多任務(wù)的鏈路預(yù)測。
現(xiàn)有的預(yù)測技術(shù)沒有解決數(shù)據(jù)稀疏性問題,沒有充分利用網(wǎng)絡(luò)的結(jié)構(gòu)信息, 不能適應(yīng)多任務(wù)的鏈路預(yù)測;
多任務(wù)預(yù)測需要學(xué)習(xí)多個機器學(xué)習(xí)模型,計算效率低下;沒有充分考慮到 多種預(yù)測任務(wù)之間的耦合促進作用。
發(fā)明內(nèi)容
本發(fā)明要克服現(xiàn)有技術(shù)的上述缺點,提供一種基于因子圖模型的社交網(wǎng)絡(luò) 多任務(wù)預(yù)測方法。
本發(fā)明是一種基于因子圖模型的社交網(wǎng)絡(luò)多任務(wù)預(yù)測方法,其流程圖如圖1 所示。本方法利用傳統(tǒng)的復(fù)雜網(wǎng)絡(luò)中鏈路預(yù)測方法作為特征,通過構(gòu)建網(wǎng)絡(luò)遷 移結(jié)構(gòu),使多種預(yù)測任務(wù)之間發(fā)生信息流動,相互耦合,解決了數(shù)據(jù)稀疏性、 計算效率低下的問題,同時提高預(yù)測結(jié)果的準(zhǔn)確性,該方法包括以下幾個步驟。
第一步,網(wǎng)絡(luò)數(shù)據(jù)獲取:通過網(wǎng)絡(luò)爬蟲收集用戶社交信息和行為信息,并 對爬取的數(shù)據(jù)進行清理,方便后續(xù)計算,主要包括網(wǎng)絡(luò)數(shù)據(jù)爬取和數(shù)據(jù)預(yù)處理。
(1)網(wǎng)絡(luò)數(shù)據(jù)爬取:爬取用戶社交行為信息和用戶對商品的行為信息,每條 信息包括:用戶UserID和用戶UserID,用戶UserID和商品ItemID。
(2)數(shù)據(jù)預(yù)處理:為了方便后續(xù)計算,需要清理數(shù)據(jù)中冗余、不完整的數(shù)據(jù), 形成模型所需要的統(tǒng)一的用戶和用戶社交行為矩陣w1,用戶和商品評分行為矩 陣w2。在矩陣w1中,矩陣中元素w1ij表示用戶i和用戶j之間的好友、關(guān)注等關(guān) 系(可以是單向也可以是雙向),在矩陣w2中,矩陣中元素w2ij表示用戶i和商 品j之間的收藏、購買、評價等關(guān)系。
第二步,建立多任務(wù)因子圖模型:
(1)網(wǎng)絡(luò)特征提取:因子圖模型是一個監(jiān)督學(xué)習(xí)模型,我們需要利用網(wǎng)絡(luò)中 的異構(gòu)信息為社交鏈接和評分鏈接提取特征。在社交網(wǎng)絡(luò)中對于一個特定的節(jié) 點i,我們可以提取節(jié)點特征,包括度k(vi),出度kout(vi),入度kin(vi),聚類 系數(shù)ci。對于社交網(wǎng)絡(luò)節(jié)點對i和j,相似性指標(biāo)是預(yù)測其在網(wǎng)絡(luò)中是否連接的 最相關(guān)的特征。因此,我們提取了一些傳統(tǒng)的相似性指標(biāo)作為特征。
交叉網(wǎng)絡(luò)(用戶和商品的評分關(guān)系)也隱藏著社交網(wǎng)絡(luò)節(jié)點對的信息,比 如他們共同評論的商品越多,則他們是朋友的可能性越大。基于此,我們根據(jù) 交叉網(wǎng)絡(luò)提取一些相似性指標(biāo)。類似的,對于交叉網(wǎng)絡(luò)目標(biāo)節(jié)點對用戶i和商品 a,我們也可以根據(jù)相似性指標(biāo)來提取特征。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于杭州師范大學(xué),未經(jīng)杭州師范大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710770816.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的處理系統(tǒng)或方法
G06Q10-00 行政;管理
G06Q10-02 .預(yù)定,例如用于門票、服務(wù)或事件的
G06Q10-04 .預(yù)測或優(yōu)化,例如線性規(guī)劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規(guī)劃、調(diào)度或分配時間、人員或機器資源;企業(yè)規(guī)劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理
- Ⅶ因子多肽和Ⅷ因子多肽的聯(lián)合應(yīng)用
- VII因子多肽和IX因子多肽的聯(lián)合應(yīng)用
- 一種城鄉(xiāng)生態(tài)規(guī)劃的生態(tài)等級空間分區(qū)規(guī)劃控制方法
- 一種基于阿爾法散度的動態(tài)PET圖像因子處理方法
- 一種設(shè)備綜合風(fēng)險評估方法、裝置和電力系統(tǒng)
- 一種集群資源容量預(yù)測方法和裝置
- 一種計算因子植入方法、介質(zhì)及設(shè)備
- 一種規(guī)模組網(wǎng)環(huán)境TI-LFA可靠性評估測試方法
- 近地表品質(zhì)因子確定方法及系統(tǒng)
- 一種模擬凝血過程的教學(xué)模型
- 社交網(wǎng)絡(luò)裝置成員資格和應(yīng)用
- 一種社交對象搜索方法及裝置
- 針對嵌入式應(yīng)用上下文中的搜索的查詢意圖表達
- 一種關(guān)鍵社交信息的確定方法及裝置
- 社交網(wǎng)絡(luò)數(shù)據(jù)的可視化方法、裝置、設(shè)備及存儲介質(zhì)
- 動態(tài)社交圈確定方法、裝置、設(shè)備及存儲介質(zhì)
- 控制社交分享信息在社交空間的呈現(xiàn)狀態(tài)的方法與設(shè)備
- 社交角色管理方法、計算機設(shè)備及存儲介質(zhì)
- 基于社交關(guān)系的社交屬性數(shù)據(jù)確定方法、裝置及設(shè)備
- 一種社交賬戶推薦方法、裝置、電子設(shè)備和存儲介質(zhì)





