[發明專利]基于社會媒體微博特定話題的摘要方法在審
| 申請號: | 201810039498.0 | 申請日: | 2018-01-16 |
| 公開(公告)號: | CN107992634A | 公開(公告)日: | 2018-05-04 |
| 發明(設計)人: | 賀瑞芳;段興義;張雪菲;李三飛 | 申請(專利權)人: | 天津大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 天津才智專利商標代理有限公司12108 | 代理人: | 王顕 |
| 地址: | 300072*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 社會 媒體 特定 話題 摘要 方法 | ||
1.一種基于社會媒體微博特定話題的摘要方法,其特征在于包括如下步驟:
1)按照下式獲取W:
其中:為基于組稀疏學習的微博摘要優化模型;S=[t1,t2,...,tn]∈Rm×n,矩陣的每一列ti為單個微博的向量表示,由TF-IDF計算得到,m表示詞匯表大小,n表示微博數;
W=[W*1,W*2,...,W*n]∈Rn×n是一個重構系數矩陣,每一列W*j=[W1j,W2j,...,Wnj]是重構第j條微博的系數向量;
λ為組稀疏正則項參數;
為社會正則項,α為社會正則項參數;L=D-T是拉普拉斯矩陣;D∈Rn×n是對角矩陣,而且T=Tcons+Tcont,Tcons=UTU,Tcont=UTFU,U∈Rd×n表示用戶-微博矩陣,其中,d為用戶數,n表示微博數Uij=1表示第j條微博tj是由第i個用戶發布;F為依據關注關系構建的用戶-用戶矩陣F∈Rd×d,其中Fij=1表示第i個與第j個用戶關聯;
2)通過計算W第i行的范式,即||Wi*||2,得到第i條微博的重要性Score(i),并依據該重要性對微博排序,進而篩選前k條微博作為摘要:
Score(i)=||Wi*||2。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津大學,未經天津大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810039498.0/1.html,轉載請聲明來源鉆瓜專利網。





