[發(fā)明專利]一種利用循環(huán)隨機游走網(wǎng)絡進行微博情感分類預測的方法在審
| 申請?zhí)枺?/td> | 201711131318.3 | 申請日: | 2017-11-15 |
| 公開(公告)號: | CN107807919A | 公開(公告)日: | 2018-03-16 |
| 發(fā)明(設計)人: | 趙洲;孟令濤;吳亦全;蔡登;何曉飛;莊越挺 | 申請(專利權)人: | 浙江大學 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06F17/30;G06Q50/00 |
| 代理公司: | 杭州求是專利事務所有限公司33200 | 代理人: | 鄭海峰 |
| 地址: | 310058 浙江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 利用 循環(huán) 隨機 游走 網(wǎng)絡 進行 情感 分類 預測 方法 | ||
1.一種利用循環(huán)隨機游走網(wǎng)絡進行微博情感分類預測的方法,其特征在于包括如下步驟:
1)針對于一組用戶及微博,構建綜合包括用戶之間社交關系及用戶與微博博文之間相互關系的網(wǎng)絡;
2)對于步驟1)所得到的社交網(wǎng)絡,利用循環(huán)隨機游走網(wǎng)絡獲取用戶未來所發(fā)微博情感分類的交叉熵損失項與某用戶在其他用戶的影響下的所發(fā)微博博文的語義一致性損失項,并將這兩者相加得到最終的損失項,通過學習,將這個最終的損失項最小化,來訓練得到最終的用戶微博情感分類預測函數(shù);
3)利用步驟2)學習得到的用戶微博情感分類預測函數(shù)獲取用戶微博的預測情感分類。
2.根據(jù)權利要求1所述利用循環(huán)隨機游走網(wǎng)絡進行微博情感分類預測的方法,其特征在于所述的步驟2)其具體步驟為:
2.1)對于步驟1)形成的綜合包括用戶之間社交關系及用戶與微博博文之間相互關系的網(wǎng)絡,利用預訓練的單詞映射網(wǎng)絡、LSTM網(wǎng)絡與softmax函數(shù)獲得用戶未來所發(fā)微博情感分類的交叉熵損失項;
2.2)利用步驟1)形成的綜合包括用戶之間社交關系及用戶與微博博文之間相互關系的網(wǎng)絡,采用隨機游走網(wǎng)絡獲取某用戶在其他用戶的影響下的所發(fā)微博博文的語義一致性的損失項,并結合步驟2.1)獲得的用戶未來所發(fā)微博情感分類的交叉熵損失項得到最終目標函數(shù);
2.3)利用步驟2.2)找出的最終目標函數(shù),通過訓練學習出所有用戶的微博情感分類預測函數(shù)。
3.根據(jù)權利要求2所述利用循環(huán)隨機游走網(wǎng)絡進行微博情感分類預測的方法,其特征在于所述的步驟2.1)具體為:
針對于步驟1)獲得的綜合包括用戶之間社交關系及用戶與微博博文之間相互關系的網(wǎng)絡,對于給定的微博博文,將其單詞通過預先訓練好的單詞映射網(wǎng)絡獲取其單詞映射;對于由一個單詞序列構成的微博博文xi,設其第t個單詞通過預先訓練好的單詞映射網(wǎng)絡獲取的單詞映射為xit,則將序列(xi1,xi2,...,xik)作為微博博文xi的單詞映射表達,之后,將博文xi分成若干段,并將各段的單詞映射序列作為LSTM網(wǎng)絡的輸入,以LSTM網(wǎng)絡的最后一個隱藏層的輸出作為該段博文的映射表達,之后將各段的輸出同時輸入一個最大池化層,將池化層的輸出ti∈Rd作為微博博文xi的映射表達,ti為一個d維向量;
之后利用softmax函數(shù)來設計用戶個性化情感分類模型,給定第j條微博博文的映射表達tj,則對于第i個用戶的個性化語義函數(shù)如下:
其中,c為所有的情感分類的種類數(shù),向量為第j條微博博文的預測情感分類向量,fui(.)為所要學習出的對于第i個用戶的某條微博的情感預測函數(shù),u0∈Rd*c為對于所有用戶的總體語義映射矩陣,ui∈Rd*c為對于第i個用戶的特定語義映射矩陣,softmax(.)為softmax函數(shù);
則對于上式最終所得向量的每一維fu,k(tj),其由如下公式計算得到:
其中u0,k與ui,k分別為u0與ui對應第k維的向量;
再結合上一步得到的用戶微博博文的情感預測向量與真實的訓練集中的用戶微博博文情感分類向量y,利用如下公式得到用戶未來所發(fā)微博情感分類的交叉熵損失項:
其中,集合Ai為第i個用戶所有的微博博文構成的集合,為第j條微博的預測情感分類,yj為第j條微博的真實情感分類,m為總體用戶數(shù),對于yj向量,其只有對應于正確情感分類的維度值為1,其余維度的值為0。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江大學,未經(jīng)浙江大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711131318.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





