[發明專利]一種利用代表向量過濾信息的方法和裝置有效
| 申請號: | 201310259175.X | 申請日: | 2013-06-26 |
| 公開(公告)號: | CN104252465B | 公開(公告)日: | 2018-10-12 |
| 發明(設計)人: | 蘇江 | 申請(專利權)人: | 南寧明江智能科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/27 |
| 代理公司: | 北京三友知識產權代理有限公司 11127 | 代理人: | 賈磊 |
| 地址: | 530003 廣西壯族自治區南*** | 國省代碼: | 廣西;45 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 利用 代表 向量 過濾 信息 方法 裝置 | ||
1.一種利用代表向量過濾信息的方法,其特征在于包括,
將信息轉換為信息向量;
將所述信息向量中相似的信息向量置于同一信息向量組中;
找出信息向量組中的代表向量;
采用人工方式和/或自動文本處理方式標記所述代表向量的類型;
將待分析信息轉換為信息向量,與所述代表向量相比較,所述待分析信息對應的信息向量匹配到某個信息向量組的代表向量,根據該代表向量所屬的類型對所述待分析信息進行相應處理。
2.根據權利要求1所述的一種利用代表向量過濾信息的方法,其特征在于,所述信息向量為該信息中濾除重復字、詞和數字之后的文本信息。
3.根據權利要求1所述的一種利用代表向量過濾信息的方法,其特征在于,所述信息包括文本信息、語音信息和/或視頻信息。
4.根據權利要求1所述的一種利用代表向量過濾信息的方法,其特征在于,在將信息轉換為信息向量中還包括,在預設的單位時間窗口內將接收到的信息轉換為信息向量。
5.根據權利要求1所述的一種利用代表向量過濾信息的方法,其特征在于,在將所述信息向量中相似的信息向量置于同一信息向量組中進一步包括,所述相似信息向量包括文本信息中字符相同。
6.根據權利要求1所述的一種利用代表向量過濾信息的方法,其特征在于,在將所述信息向量中相似的信息向量置于同一信息向量組中進一步包括,對所述信息的行為進行分析,去除不符合預定條件的信息向量組。
7.根據權利要求6所述的一種利用代表向量過濾信息的方法,其特征在于,上述不符合預定條件包括,所述信息向量組中信息發送方賬號的數量和接收所述信息的賬號數量的比值超過第一預定閥值;
所述信息向量組中信息發送方賬號數量和接收所述信息的賬號數量的比值接近于1或者第二預定閥值;
所述信息向量組中信息發送方賬號數量和接收所述信息的賬號數量的比值小于第三預定閥值。
8.根據權利要求1所述的一種利用代表向量過濾信息的方法,其特征在于,在將所述信息向量中相似的信息向量置于同一信息向量組后還包括,如果所述信息向量組中的信息向量數量小于一預定閥值,則去除所述信息向量組。
9.根據權利要求1所述的一種利用代表向量過濾信息的方法,其特征在于,在找出信息向量組中的代表向量中進一步包括,計算所述信息向量組的平均長度I;
統計該信息向量組中信息向量的出現頻次;
選擇出現頻次最高的I個信息向量作為所述信息向量組的代表向量。
10.根據權利要求1所述的一種利用代表向量過濾信息的方法,其特征在于,在對代表向量進行分類后還包括對代表向量所屬分類標記信心度,所述信心度代表該代表向量屬于某個分類的可能性。
11.根據權利要求10所述的一種利用代表向量過濾信息的方法,其特征在于,在將待分析信息轉換為信息向量,與所述代表向量相比較,如果與所述代表向量匹配則濾除所述待分析信息中進一步包括,所述待分析信息對應的信息向量匹配到某個信息向量組的代表向量,根據該代表向量所屬的分類和該分類的信心度對所述待分析信息進行相應處理。
12.一種利用代表向量過濾信息的裝置,其特征在于包括,
轉換單元,用于將信息轉換為信息向量;
分組單元,用于將所述信息向量中相似的信息向量置于同一信息向量組中;
代表向量單元,用于找出信息向量組中的代表向量;
分類模塊,用于采用人工方式和/或自動文本處理方式標記所述代表向量的類型;
所述轉換單元將待分析信息轉換為信息向量后發送給匹配單元,所述匹配單元將所述待分析的信息向量與所述代表向量相比較,如果與所述代表向量匹配則濾除所述待分析信息;
所述匹配單元將所述待分析的信息向量與所述代表向量相比較,所述待分析信息對應的信息向量匹配到某個信息向量組的代表向量,根據該代表向量所屬的類型對所述待分析信息進行相應處理。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南寧明江智能科技有限公司,未經南寧明江智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310259175.X/1.html,轉載請聲明來源鉆瓜專利網。





