[發(fā)明專利]一種郵件分類識別方法在審
| 申請?zhí)枺?/td> | 201410547075.1 | 申請日: | 2014-10-14 |
| 公開(公告)號: | CN104361015A | 公開(公告)日: | 2015-02-18 |
| 發(fā)明(設計)人: | 羅陽;陳虹宇;王峻嶺 | 申請(專利權)人: | 四川神琥科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京天奇智新知識產(chǎn)權代理有限公司 11340 | 代理人: | 郭霞 |
| 地址: | 610041 四川省成都市高新*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 郵件 分類 識別 方法 | ||
1.一種郵件分類識別方法,其特征在于,該方法包括以下步驟:
步驟1,獲取用戶收發(fā)郵件時的表情和/或語音特征數(shù)據(jù);并按照所述表情和/或語音特征數(shù)據(jù)獲得用戶收發(fā)的郵件的分類屬性,所述分類屬性包括:正常郵件、垃圾郵件和無法確認;
如果所獲得的分類屬性為正常郵件或垃圾郵件,則結束分類,否則執(zhí)行步驟2;
步驟2,依次使用多個分類器對郵件進行分類。
2.根據(jù)權利要求1所述的郵件分類識別方法,其特征在于,在步驟2之后還包括以下步驟:
步驟3,將每個分類器的分類結果發(fā)送至決策中心,在決策中心采用投票算法對所述多個分類器得到的分類結果進行投票,得到最終分類結果;
步驟4,對所述多個分類器進行增量更新,并用最終分類結果更新預設表情和/或語音特征數(shù)據(jù)庫。
3.根據(jù)權利要求2所述的郵件分類識別方法,其特征在于,在步驟1后,且步驟2前包括:
對郵件進行分詞、特征向量提取、權重計算預處理;
其中,所述特征向量提取包括:郵件頭特征向量提取、附件特征向量提取、以及正文特征向量提取;并且
提取的特征向量以數(shù)據(jù)庫字段的方式存入特征向量數(shù)據(jù)庫。
4.根據(jù)權利要求3所述的郵件分類識別方法,其特征在于,所述分類器可采用基于決策樹的學習算法構建。
5.根據(jù)權利要求4所述的郵件分類識別方法,其特征在于,對所述多個分類器進行增量更新包括:
每收發(fā)一封郵件,獲取該郵件的特征向量;
判斷所述特征向量是否位于已構建分類器的分類間隔內;
若在所述分類間隔內,將該郵件暫時存儲;
當存儲的郵件數(shù)目達到預先設定數(shù)值時,將存儲的郵件的特征向量與已構建分類器的支持向量共同作為新的訓練樣本集,對已構建的分類器進行增量更新;
刪除暫時存儲的郵件。
6.根據(jù)權利要求5所述的郵件分類識別方法,其特征在于,所述多個分類器可包括:SVM分類器、KNN分類器和貝葉斯分類器。
7.根據(jù)權利要求1-6中任一項所述的郵件分類識別方法,其特征在于,
所述表情特征數(shù)據(jù)包括:眼睛位置信息、眼睛形狀信息、眉毛位置信息、眉毛形狀信息、嘴巴位置信息和嘴巴形狀信息;
所述語音特征數(shù)據(jù)包括:聲調信息、語速信息、以及過濾性關鍵詞。
8.根據(jù)權利要求7所述的郵件分類識別方法,其特征在于,所述步驟1中按照所述表情和/或語音特征數(shù)據(jù)獲得用戶收發(fā)的郵件的分類屬性包括:
從預設表情和/或語音特征數(shù)據(jù)庫查找與所述表情和/或語音特征數(shù)據(jù)相匹配的預設表情和/或語音特征數(shù)據(jù);
當查找出所述表情和/或語音特征數(shù)據(jù)與第一預設表情和/或語音特征數(shù)據(jù)相匹配時,確定所述表情和/或語音特征數(shù)據(jù)對應的表情和/或語音數(shù)據(jù)為第一表情和/或語音數(shù)據(jù),并確定所述用戶收發(fā)的郵件的類型為第一類型,其中,所述第一預設表情和/或語音特征數(shù)據(jù)為所述預設表情和/或語音特征數(shù)據(jù)庫中的任一表情和/或語音特征數(shù)據(jù),所述預設表情和/或語音特征數(shù)據(jù)庫中還存儲有表情和/或語音特征數(shù)據(jù)與郵件類型的對應關系;以及
當查找出所述表情和/或語音特征數(shù)據(jù)與第二預設表情和/或語音特征數(shù)據(jù)相匹配時,確定所述表情和/或語音特征數(shù)據(jù)對應的表情和/或語音數(shù)據(jù)為第二表情和/或語音數(shù)據(jù),并確定所述用戶收發(fā)的郵件的類型為第二類型,其中,所述第二預設表情和/或語音特征數(shù)據(jù)為所述預設表情和/或語音特征數(shù)據(jù)庫中的任一表情和/或語音特征數(shù)據(jù),并且所述第二預設表情和/或語音特征數(shù)據(jù)與所述第一預設表情和/或語音特征數(shù)據(jù)為不同的表情和/或語音特征數(shù)據(jù)。
9.根據(jù)權利要求8所述的郵件分類識別方法,其特征在于,
在確定所述用戶收發(fā)的郵件的類型為第二類型之后,還包括:
比較所述第一表情和/或語音數(shù)據(jù)和所述第二表情和/或語音數(shù)據(jù)的優(yōu)先級;
在比較出所述第一表情和/或語音數(shù)據(jù)的優(yōu)先級高于所述第二表情和/或語音數(shù)據(jù)的優(yōu)先級時,控制所述第一類型的郵件排列在所述第二類型的郵件之前;以及
在比較出所述第一表情和/或語音數(shù)據(jù)的優(yōu)先級低于所述第二表情和/或語音數(shù)據(jù)的優(yōu)先級時,控制所述第一類型的郵件排列在所述第二類型的郵件之后。
10.根據(jù)權利要求9所述的郵件分類識別方法,其特征在于,
在比較所述第一表情和/或語音數(shù)據(jù)和所述第二表情和/或語音數(shù)據(jù)的優(yōu)先級之前,還包括:
接收所述用戶的設定指令;以及
根據(jù)所述設定指令確定所述第一表情和/或語音數(shù)據(jù)和所述第二表情和/或語音數(shù)據(jù)的優(yōu)先級。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于四川神琥科技有限公司,未經(jīng)四川神琥科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410547075.1/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。





