[發(fā)明專利]一種推送微博的方法及裝置有效
| 申請?zhí)枺?/td> | 201210385036.7 | 申請日: | 2012-10-11 |
| 公開(公告)號: | CN102968439A | 公開(公告)日: | 2013-03-13 |
| 發(fā)明(設計)人: | 伏圣國 | 申請(專利權(quán))人: | 微夢創(chuàng)科網(wǎng)絡科技(中國)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;H04L29/08 |
| 代理公司: | 北京同達信恒知識產(chǎn)權(quán)代理有限公司 11291 | 代理人: | 黃志華 |
| 地址: | 100080 北京*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 推送 方法 裝置 | ||
1.一種推送微博的方法,其特征在于,包括:
接收在設定時間間隔內(nèi)發(fā)布的各微博,確定接收到的各微博中的關(guān)鍵詞;
根據(jù)確定出的各關(guān)鍵詞,采用設定方法確定關(guān)鍵詞集合,并確定采用所述設定方法所能確定出的所有關(guān)鍵詞集合,其中,所述設定方法為:在各關(guān)鍵詞中任意選擇兩個關(guān)鍵詞構(gòu)成一個關(guān)鍵詞集合;
根據(jù)確定出的各關(guān)鍵詞集合中每兩個關(guān)鍵詞集合的交集和并集中包含的關(guān)鍵詞,對確定出的各關(guān)鍵詞集合進行增量聚類,得到各聚類關(guān)鍵詞集合;
針對得到的每個聚類關(guān)鍵詞集合,判斷熱點輿情庫中是否存在與該聚類關(guān)鍵詞集合的相似度大于設定相似度的熱點輿情關(guān)鍵詞集合,當不存在時,在接收到的各微博中,選擇與該聚類關(guān)鍵詞集合相關(guān)的微博推送給相關(guān)用戶,并將該聚類關(guān)鍵詞集合作為熱點輿情關(guān)鍵詞集合保存在所述熱點輿情庫中。
2.如權(quán)利要求1所述的方法,其特征在于,確定接收到的各微博中的關(guān)鍵詞,具體包括:
對接收到的各微博進行分詞處理,在得到的各分詞中確定指定類型的分詞,作為確定出的關(guān)鍵詞。
3.如權(quán)利要求1所述的方法,其特征在于,根據(jù)確定出的各關(guān)鍵詞,采用設定方法確定關(guān)鍵詞集合,具體包括:
針對確定出的每個關(guān)鍵詞,根據(jù)該關(guān)鍵詞在接收到的每個微博中出現(xiàn)的次數(shù)的和、接收到的微博的數(shù)量,以及預先保存的該關(guān)鍵詞的逆文檔頻率,采用公式確定該關(guān)鍵詞的權(quán)重,其中,nword為該關(guān)鍵詞在接收到的每個微博中出現(xiàn)的次數(shù)的和,N為接收到的微博的數(shù)量,Idf為預先保存的該關(guān)鍵詞的逆文檔頻率,Wordweight為確定的該關(guān)鍵詞的權(quán)重;
根據(jù)確定的每個關(guān)鍵詞的權(quán)重,按照權(quán)重從大到小的順序依次選擇第一設定數(shù)量的關(guān)鍵詞,根據(jù)選擇出的第一設定數(shù)量的關(guān)鍵詞,采用設定方法確定關(guān)鍵詞集合。
4.如權(quán)利要求3所述的方法,其特征在于,根據(jù)確定出的各關(guān)鍵詞集合中每兩個關(guān)鍵詞集合的交集和并集中包含的關(guān)鍵詞,對確定出的各關(guān)鍵詞集合進行增量聚類之前,所述方法還包括:
針對確定出的每個關(guān)鍵詞集合,確定該關(guān)鍵詞集合中包含的兩個關(guān)鍵詞的互信息,根據(jù)確定的該關(guān)鍵詞集合中包含的兩個關(guān)鍵詞的互信息,以及該兩個關(guān)鍵詞的權(quán)重,采用公式確定該關(guān)鍵詞集合的權(quán)重,其中,i表示該關(guān)鍵詞集合中包含的關(guān)鍵詞i,j表示該關(guān)鍵詞集合中包含的關(guān)鍵詞j,為關(guān)鍵詞i的權(quán)重,為關(guān)鍵詞j的權(quán)重,Dweight為確定的該關(guān)鍵詞集合的權(quán)重,I(i,j)為關(guān)鍵詞i和關(guān)鍵詞j的互信息,且p(i)為接收到的一個微博包含該關(guān)鍵詞i的概率,p(j)為接收到的一個微博包含該關(guān)鍵詞j的概率,p(i,j)為接收到的一個微博同時包含該關(guān)鍵詞i和關(guān)鍵詞j的概率;
根據(jù)確定的每個關(guān)鍵詞集合的權(quán)重,按照權(quán)重從大到小的順序依次選擇第二設定數(shù)量的關(guān)鍵詞集合;
根據(jù)確定出的各關(guān)鍵詞集合中每兩個關(guān)鍵詞集合的交集和并集中包含的關(guān)鍵詞,對確定出的各關(guān)鍵詞集合進行增量聚類,具體包括:
根據(jù)選擇的第二設定數(shù)量的關(guān)鍵詞集合中每兩個關(guān)鍵詞集合的交集和并集中包含的關(guān)鍵詞,對選擇的第二設定數(shù)量的關(guān)鍵詞集合進行增量聚類。
5.如權(quán)利要求4所述的方法,其特征在于,對選擇的第二設定數(shù)量的關(guān)鍵詞集合進行增量聚類,具體包括:
根據(jù)選擇每個關(guān)鍵詞集合的權(quán)重,將選擇的第二設定數(shù)量的關(guān)鍵詞集合按照權(quán)重從大到小的順序進行排序;
按照關(guān)鍵詞集合排序的先后順序,依次針對每個關(guān)鍵詞集合,執(zhí)行下述步驟A~B:
步驟A、將當前針對的關(guān)鍵詞集合作為待聚類關(guān)鍵詞集合,確定排在待聚類關(guān)鍵詞集合之前的每個關(guān)鍵詞集合,作為前序關(guān)鍵詞集合;
步驟B、針對確定的每個前序關(guān)鍵詞集合,確定待聚類關(guān)鍵詞集合與該前序關(guān)鍵詞集合的交集中包含的關(guān)鍵詞的第一數(shù)量,確定待聚類關(guān)鍵詞集合與該前序關(guān)鍵詞集合的并集中包含的關(guān)鍵詞的第二數(shù)量,當?shù)谝粩?shù)量與第二數(shù)量的比值大于設定比值時,將待聚類關(guān)鍵詞集合中滿足第一指定條件的關(guān)鍵詞添加到該前序關(guān)鍵詞集合中,其中,滿足第一指定條件的關(guān)鍵詞為:包含在該待聚類關(guān)鍵詞集合中、且未包含在該前序關(guān)鍵詞集合中的關(guān)鍵詞。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于微夢創(chuàng)科網(wǎng)絡科技(中國)有限公司,未經(jīng)微夢創(chuàng)科網(wǎng)絡科技(中國)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210385036.7/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種被磁偏置的敏感方向平行于檢測面的驗鈔磁頭
- 下一篇:一種斷橋隔熱幕墻





