[發明專利]一種電子郵件的信息提取系統在審
| 申請號: | 201711307359.3 | 申請日: | 2017-12-11 |
| 公開(公告)號: | CN108038189A | 公開(公告)日: | 2018-05-15 |
| 發明(設計)人: | 龍炳林;陸豐勤 | 申請(專利權)人: | 南京茂毓通軟件科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/27 |
| 代理公司: | 南京蘇高專利商標事務所(普通合伙) 32204 | 代理人: | 饒欣 |
| 地址: | 210012 江蘇省南京市雨*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 電子郵件 信息 提取 系統 | ||
1.一種電子郵件的信息提取系統,其特征在于:包括郵件信息提取引擎,郵件信息提取引擎通過訓練集對分類模型進行訓練,然后利用分詞工具對郵件內容進行分詞,最后用訓練好的分類模型對分詞后的郵件內容進行分類,得到郵件內容的類別;當用戶給郵件手動打上類別標簽后,郵件自動放回到對應類別的訓練集中。
2.根據權利要求1所述的電子郵件的信息提取系統,其特征在于:所述郵件信息提取引擎還包括附件解析模塊和解壓縮模塊,能夠對加密附件進行識別:當附件不是壓縮文件時,通過附件解析模塊解析附件,如果附件能夠被正常解析,則判定附件沒有加密,如果附件不能被正常解析,則判定附件已加密;當附件是壓縮文件時,通過解壓縮模塊對附件進行解壓,如果附件能夠被正常解壓,則判定附件沒有加密,如果附件不能被正常解壓,則判定附件已加密。
3.根據權利要求1所述的電子郵件的信息提取系統,其特征在于:所述郵件信息提取引擎還包括郵件解析模塊,郵件解析模塊能夠對郵件進行解析,從解析結果中直接提取出郵件正文、郵件主題、收件人、發件人、抄送人及密送人的賬號和昵稱、郵件發送時間、收件人是否查收、語言編碼、附件名和附件個數。
4.根據權利要求1所述的電子郵件的信息提取系統,其特征在于:所述郵件信息提取引擎還能夠對郵件摘要進行提取:先擬定一個權重評分標準,然后給每個句子打分,最后給出排名靠前的若干個句子作為提取結果。
5.根據權利要求1所述的電子郵件的信息提取系統,其特征在于:所述郵件信息提取引擎還通過ngram對郵件正文內容進行語種識別。
6.根據權利要求1所述的電子郵件的信息提取系統,其特征在于:所述郵件信息提取引擎還通過層疊馬爾可夫模型和角色標注的中文命名實體識別方法對郵件內容中的實體信息進行抽取。
7.根據權利要求1所述的電子郵件的信息提取系統,其特征在于:所述信息提取系統還包括郵件附件信息提取引擎,郵件附件信息提取引擎包括附件解析模塊,所述附件解析模塊能夠提取出附件的內容。
8.根據權利要求1所述的電子郵件的信息提取系統,其特征在于:所述信息提取系統還包括隱性信息提取引擎,隱性信息提取引擎包括郵件解析模塊,所述隱性信息提取引擎能夠提取轉發關系:利用郵件解析模塊對郵件進行解析,然后提取出發件人、收件人字段內容和時間字段內容。
9.根據權利要求8所述的電子郵件的信息提取系統,其特征在于:所述隱性信息提取引擎能夠提取實體關系:確定各個實體,即郵件登陸者賬號、郵件昵稱、郵件附件和郵件基本信息,然后對各個實體進行關聯分析。
10.根據權利要求9所述的電子郵件的信息提取系統,其特征在于:所述關聯分析包括以下關系模型:賬號與昵稱關系、郵件與附件關系、郵件與發件人關系、郵件與收件人關系。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京茂毓通軟件科技有限公司,未經南京茂毓通軟件科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711307359.3/1.html,轉載請聲明來源鉆瓜專利網。
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





