[發(fā)明專利]互聯網新聞的監(jiān)控方法和裝置有效
| 申請?zhí)枺?/td> | 201110455183.2 | 申請日: | 2011-12-28 |
| 公開(公告)號: | CN103186599A | 公開(公告)日: | 2013-07-03 |
| 發(fā)明(設計)人: | 王松;楊建武;梁汝峰;張濤;孫紅娥 | 申請(專利權)人: | 北大方正集團有限公司;北京大學;北京北大方正電子有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京英賽嘉華知識產權代理有限責任公司 11204 | 代理人: | 王達佐 |
| 地址: | 100871 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 互聯網 新聞 監(jiān)控 方法 裝置 | ||
1.一種互聯網新聞的監(jiān)控方法,其特征在于,包括:
獲取互聯網新聞的相關信息;
以監(jiān)管指令匹配所述互聯網新聞的相關信息;
提交匹配結果。
3.根據權利要求2所述的方法,其特征在于,獲取所述鏈接的新聞源文件的內容包括:
獲取所述鏈接的新聞源文件;
剔除所述新聞源文件中的無用標簽;將剩余部分根據劃分區(qū)域標簽拆封為各個子塊;
根據各子快的大小、上下子塊塊之間的距離和標題分詞以獲取所述內容。
4.根據權利要求1所述的方法,其特征在于,以監(jiān)管指令匹配所述互聯網新聞的相關信息包括:
獲取所述監(jiān)管指令;
判斷所述監(jiān)管指令是否處于有效期;
將處于有效期的所述監(jiān)管指令匹配所述互聯網新聞的相關信息。
5.根據權利要求4所述的方法,其特征在于,將處于有效期的所述監(jiān)管指令匹配所述互聯網新聞的相關信息包括:
確定當前的監(jiān)管指令只包括標題關鍵詞;
根據所述互聯網新聞的標題和各所述標題關鍵詞的匹配次數及各所述標題關鍵詞的權重設置匹配值;
根據匹配到的關鍵詞數和指令配置的關鍵詞數的比例做矯正;
用矯正的匹配值與預設的參考系數比較,判斷是否匹配。
6.根據權利要求5所述的方法,其特征在于,設置匹配值P=n1*w1+n2*w2+...+nn*wn+(np/n)*X,其中,所述當前的監(jiān)管指令只包括n個標題關鍵詞,其權重為w1...wn,匹配次數分別為n1...nn,共有np個標題關鍵詞存在匹配,矯正值為X。
7.根據權利要求4所述的方法,其特征在于,將處于有效期的所述監(jiān)管指令匹配所述互聯網新聞的相關信息包括:
確定當前的監(jiān)管指令包括含有標題關鍵詞和正文關鍵詞;
根據所述互聯網新聞的標題和各所述標題關鍵詞的匹配次數及各所述標題關鍵詞的權重,以及所述互聯網新聞的正文和各所述正文關鍵詞的匹配次數及各所述正文關鍵詞的權重設置匹配值;
根據匹配到的關鍵詞數和指令配置的關鍵詞數的比例做矯正;
用矯正的匹配值與預設的參考系數比較,判斷是否匹配。
8.根據權利要求7所述的方法,其特征在于,設置匹配值P=n標1*w標1+n標2*w標2+...+n標n*w標n+m正1*w正1+m正2*w正2+...+m正m*w正m+((n標p/n標)*X標+(m正p/m正)*X正)/2,其中,所述當前的監(jiān)管指令包括n個標題關鍵詞,其權重為w標1...w標n,匹配次數分別為n標1...n標n,共有n標p個標題關鍵詞存在匹配,矯正值為X標;所述當前的監(jiān)管指令包括m個正文關鍵詞,其權重為w正1...w正m,匹配次數分別為m正1...m正m,共有m正p個正文關鍵詞存在匹配,矯正值為X正。
9.根據權利要求1-8任一項所述的方法,其特征在于,所述監(jiān)管指令包括以下至少一項:正面宣傳指令、負面宣傳指令、指定鏈接撤銷。
10.一種互聯網新聞的監(jiān)控裝置,其特征在于,包括:
獲取模塊,用于獲取互聯網新聞的相關信息;
匹配模塊,用于以監(jiān)管指令匹配所述互聯網新聞的相關信息;
提交模塊,用于提交匹配結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北大方正集團有限公司;北京大學;北京北大方正電子有限公司,未經北大方正集團有限公司;北京大學;北京北大方正電子有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110455183.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:正確數據的獲取方法和裝置
- 下一篇:一種錄音或者錄像文件自動命名的方法和裝置





