[發明專利]基于mbx格式的郵件正文的獲取方法及系統有效
| 申請號: | 201310521274.0 | 申請日: | 2013-10-28 |
| 公開(公告)號: | CN103559244A | 公開(公告)日: | 2014-02-05 |
| 發明(設計)人: | 吳子章;劉申 | 申請(專利權)人: | 東軟集團股份有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京鴻元知識產權代理有限公司 11327 | 代理人: | 陳英俊 |
| 地址: | 110179 遼*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 mbx 格式 郵件 正文 獲取 方法 系統 | ||
1.一種基于mbx格式的郵件正文的獲取方法,包括:
將mbx格式的郵件批量映射到內存;
將批量映射到內存的所述mbx格式的郵件的首行轉換成模式串,并將所述模式串的前六個字節作為模式子串,在批量映射到內存的所述mbx格式的郵件除首行之外的其余行的首部位置添加標志;將每行所述標志后的六個字節形成數據塊映射到緩存上,然后對所述數據塊進行分組,篩選出每組數據塊中的所述模式子串,并記錄所述模式子串的位置;并且,通過查找每行首部位置的所述標志確定并記錄空行的位置;
通過匹配所述空行的位置和所述模式子串的位置確定郵件正文的位置;
根據所確定的郵件正文的位置獲取所述郵件正文。
2.如權利要求1所述的基于mbx格式的郵件正文的獲取方法,其中,在篩選每組數據塊中的所述模式子串的過程中,
將所述模式子串分成字母模式串和符號模式串,分別進行hash值的計算;
對所述字母模式串和所述符號模式串依次向左偏移八字節計算hash值,分別存儲在字母模式串和符號模式串的hash表中,公式如下:
其中,char?At(i)表示模式子串的第i個元素的ASCII碼值;
查詢字母模式串的hash表和查詢所述符號模式串的hash表;其中,
如果所述字母模式串未偏移計算出的hash值與所述字母模式串向左偏移八字節計算出的hash值相等,并且所述符號模式串未偏移計算出的hash值與所述符號模式串向左偏移八字節計算出的hash值相等,則模式子串匹配成功;
篩選出匹配成功的模式子串。
3.如權利要求1所述的基于mbx格式的郵件正文的獲取方法,其中,在對數據塊進行分組的過程中,
第一組的行數為預設行數,其余行數為平均郵件頭的長度。
4.如權利要求1所述的基于mbx格式的郵件正文的獲取方法,其中,在通過查找每行首部位置的所述標志確定空行的位置的過程中,
如果在所述標志后查找到換行符,則將與所述換行符所在的行確定為空行。
5.一種基于mbx格式的郵件正文的獲取系統,包括:
郵件映射單元,用于將mbx格式的郵件批量映射到內存;
模式串轉換單元,用于將批量映射到內存的所述mbx格式的郵件的首行轉換成模式串;
模式子串生成單元,用于將所述模式串的前六個字節作為模式子串;
標志添加單元,用于在批量映射到內存的所述mbx格式的郵件除首行之外的其余行的首部位置添加標志;
數據塊映射單元,用于將每行所述標志后的六個字節形成數據塊映射到緩存上;
數據塊分組單元,用于對映射到緩存上的所述數據塊進行分組;
模式子串篩選單元,用于篩選出每組數據塊中的所述模式子串;
模式子串記錄單元,用于記錄篩選出的所述模式子串的位置;
空行位置確定單元,用于通過查找所述標志確定空行的位置;
空行位置記錄單元,用于記錄確定出的空行的位置;
郵件正文確定單元,用于通過匹配所述空行的位置和所述模式子串的位置確定郵件正文的位置;
郵件正文獲取單元,用于根據所確定的郵件正文的位置獲取所述郵件正文。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東軟集團股份有限公司,未經東軟集團股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310521274.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種數據業務處理方法及裝置
- 下一篇:一種可移動法蘭端面加工機械





