[發明專利]一種微博過濾方法及裝置在審
| 申請號: | 201410149140.5 | 申請日: | 2014-04-11 |
| 公開(公告)號: | CN104978370A | 公開(公告)日: | 2015-10-14 |
| 發明(設計)人: | 溫冬開;冼頌文;余剛;梁彬;李勝勇;黃志斌 | 申請(專利權)人: | 中國移動通信集團廣東有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/40;H04L12/58;H04L29/06 |
| 代理公司: | 北京銀龍知識產權代理有限公司 11243 | 代理人: | 許靜;黃燦 |
| 地址: | 510623 廣東省廣州市珠*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 過濾 方法 裝置 | ||
技術領域
本發明涉及通信領域,尤其涉及一種微博過濾方法及裝置。
背景技術
隨著互聯網的發展,互聯網上的信息尤其是社交媒體上的信息正在爆炸式的增長。2009年,每分鐘有超過20個小時的視頻被上傳到YouTube;2013年,每分鐘超過72個小時。2009年,Twitter每天有250萬條推特;2013年,這一數字變為3.4億條。信息量瘋狂增長的背后是大量重復內容的反復出現,這些信息大量地干擾了用戶的精力,也正在嚴重地影響了人們使用社交媒體的興趣。因而對社交媒體上同質化重復內容的過濾變得尤為迫切和重要。
專利102591951A提供了一種過濾微博信息的方法,如圖1所示,包括如下步驟:
步驟10,初始化關鍵詞字典;
步驟20,對微博信息進行分段,并在正向上從微博信息段的起始字符開始,對微博信息段進行分詞;
步驟30,進行哈希比對所述分詞與所述關鍵詞字典中的關鍵詞,并篩選出命中關鍵詞的微博信息。
這種方法是從關鍵詞過濾角度來進行微博信息篩選。
由上描述可以看出,這種方法能夠通過關鍵詞匹配篩選掉不想看的微博信息,具備一定的實用性。但這種方法的缺點在于:
(1)基于哈希算法的關鍵詞匹配非常消耗計算資源和時間,效率偏低。
(2)簡單地通過關鍵詞匹配過濾微博信息容易將有價值的信息一并過濾掉。
發明內容
為了解決上述技術問題,本發明提供了一種微博過濾方法及裝置,能夠對轉發的微博信息進行有效且簡便地過濾,提高了信息過濾效率。
為了實現上述目的,本發明提供了一種微博過濾方法,包括:獲取步驟:獲取一過濾規則,所述過濾規則中包括對不帶有轉發評論的微博進行過濾的規則;確定步驟:根據所述過濾規則及微博的屬性,確定符合所述過濾規則的微博,所述微博的屬性包括:所述微博是否帶有轉發評論;屏蔽步驟:對不帶有轉發評論的微博進行屏蔽。
優選的,所述過濾規則中還包括根據微博的發布者對微博進行過濾的規則,所述微博的屬性還包括微博的發布者信息,所述屏蔽步驟進一步對由所述過濾規則中確定的發布者轉發的且不帶有轉發評論的微博進行屏蔽。
優選的,所述過濾規則中還包括根據微博的發布時間對微博進行過濾的規則,所述微博的屬性還包括微博的發布時間信息,所述屏蔽步驟進一步對由所述過濾規則中確定的發布時間范圍內轉發的且不帶有轉發評論的微博進行屏蔽。
優選的,每一微博具有一唯一標識符,所述標識符中包括所述微博的屬性的字段。
本發明還提供了一種微博過濾裝置,包括:獲取模塊,用于獲取一過濾規則,所述過濾規則中包括對不帶有轉發評論的微博進行過濾的規則;確定模塊,用于根據所述過濾規則及微博的屬性,確定符合所述過濾規則的微博,所述微博的屬性包括:所述微博是否帶有轉發評論;屏蔽模塊,用于對不帶有轉發評論的微博進行屏蔽。
優選的,所述過濾規則中還包括根據微博的發布者對微博進行過濾的規則,所述微博的屬性還包括微博的發布者信息,所述屏蔽模塊進一步用于對由所述過濾規則中確定的發布者轉發的且不帶有轉發評論的微博進行屏蔽。
優選的,括所述過濾規則中還包括根據微博的發布時間對微博進行過濾的規則,所述微博的屬性還包括微博的發布時間信息,所述屏蔽模塊進一步用于對由所述過濾規則中確定的發布時間范圍內轉發的且不帶有轉發評論的微博進行屏蔽。
優選的,每一微博具有一唯一標識符,所述標識符中包括所述微博的屬性的字段。
本發明的上述技術方案的有益效果如下:
本發明提供了一種微博過濾方法及裝置,能夠對轉發的微博信息進行有效且簡便地過濾,提高了信息過濾效率。
附圖說明
圖1為專利102591951A提供的一種過濾微博信息的方法流程圖。
圖2為本發明實施例1提供的一種微博過濾方法流程圖。
圖3為本發明實施例1提供的一種微博過濾裝置結構示意圖。
圖4為本發明實施例2提供的信息標記方法中信息變化圖。
圖5為本發明實施例2提供的信息過濾方法中信息變化圖。
圖6為本發明實施例2提供的信息標記方法流程圖。
圖7為本發明實施例2提供的信息過濾方法流程圖。
具體實施方式
為使本發明要解決的技術問題、技術方案和優點更加清楚,下面將結合附圖及具體實施例進行詳細描述。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國移動通信集團廣東有限公司,未經中國移動通信集團廣東有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410149140.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種語料過濾方法及裝置
- 下一篇:基于移動終端的語音數據索引建立方法和系統





