[發(fā)明專利]基于深度學習的郵件標簽方法、系統(tǒng)、設備及存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202011344783.7 | 申請日: | 2020-11-26 |
| 公開(公告)號: | CN112257814A | 公開(公告)日: | 2021-01-22 |
| 發(fā)明(設計)人: | 王思博;羅超;胡泓;李巍;鄒宇 | 申請(專利權)人: | 攜程計算機技術(上海)有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/08 |
| 代理公司: | 上海隆天律師事務所 31282 | 代理人: | 鐘宗 |
| 地址: | 200233 上海*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 深度 學習 郵件 標簽 方法 系統(tǒng) 設備 存儲 介質(zhì) | ||
1.一種基于深度學習的郵件標簽方法,其特征在于,包括以下步驟:
S110、建立郵件數(shù)據(jù)隊列,采集所述郵件數(shù)據(jù)隊列中第一類預設字段的數(shù)據(jù)消息,所述第一類預設字段至少包括發(fā)件人郵箱、郵件主題;
S120、判斷所述郵件是否為匿名聯(lián)系用戶的預設業(yè)務,若是,則執(zhí)行步驟S130,若否,則結束;
S130、解析郵件文本內(nèi)容,抓取第二類預設字段的內(nèi)容,所述第二類預設字段至少包括郵件正文;
S140、對所述第二類預設字段的內(nèi)容進行預處理;
S150、基于所述第二類預設字段的內(nèi)容的語種,分別輸入到基于不同語言的經(jīng)過訓練的標簽分類模型,獲得所述郵件文本內(nèi)容對應的至少一個標簽;
S160、根據(jù)所述郵件文本內(nèi)容的標簽與預設標簽映射表的映射關系,獲得郵件處理流程信息;以及
S170、將所述郵件處理流程信息發(fā)送到預設的處理郵箱。
2.根據(jù)權利要求1所述的基于深度學習的郵件標簽方法,其特征在于,所述步驟S110中,所述第一類預設字段包括訂單號、郵件ID、郵件下載地址、發(fā)件人郵箱、郵件主題。
3.根據(jù)權利要求1所述的基于深度學習的郵件標簽方法,其特征在于,所述步驟S120中,根據(jù)發(fā)件人郵箱、郵件主題判斷是否是酒店匿名聯(lián)系客人的業(yè)務。
4.根據(jù)權利要求1所述的基于深度學習的郵件標簽方法,其特征在于,所述步驟S130中,通過HTTP請求的方式,解析出郵件的文本內(nèi)容,所述第二類預設字段包括收發(fā)件人信息、郵件主題、郵件正文、歷史郵件對話信息。
5.根據(jù)權利要求1所述的基于深度學習的郵件標簽方法,其特征在于,所述步驟S140中,包括以下步驟:
S141、根據(jù)收發(fā)件人信息,定位當前郵件的文本內(nèi)容,過濾掉歷史郵件對話信息;
S142、根據(jù)所述郵件主題以及搜索所述郵件正文內(nèi)容中預設郵件開頭語的位置,定位郵件正文內(nèi)容;
S143、當所述郵件語言是繁體中文,轉(zhuǎn)換成簡體中文;
S144、當所述郵件語言是中文,進行中文分詞。
6.根據(jù)權利要求1所述的基于深度學習的郵件標簽方法,其特征在于,所述步驟S150中,所述標簽分類模型為經(jīng)過預訓練的ALBERT模型,所述ALBERT模型輸出的分類標簽包括滿房、切客、確認后漲價、索要手機號、支付。
7.根據(jù)權利要求1所述的基于深度學習的郵件標簽方法,其特征在于,所述步驟S160中,所述預設標簽映射表中包括每個所述標簽與至少一郵件處理流程信息的映射關系;
所述步驟S170中,包括處理信息自所述標簽對應的郵件抓取的至少包括郵件ID、訂單號、郵件發(fā)生時間、標簽。
8.一種基于深度學習的郵件標簽系統(tǒng),用于實現(xiàn)權利要求1所述的基于深度學習的郵件標簽方法,其特征在于,包括:
數(shù)據(jù)隊列模塊,建立郵件數(shù)據(jù)隊列,采集所述郵件數(shù)據(jù)隊列中第一類預設字段的數(shù)據(jù)消息,所述第一類預設字段至少包括發(fā)件人郵箱、郵件主題;
匿名判斷模塊,判斷所述郵件是否為匿名聯(lián)系用戶的預設業(yè)務,若是,則執(zhí)行步驟S130,若否,則結束;
解析郵件模塊,解析郵件文本內(nèi)容,抓取第二類預設字段的內(nèi)容,所述第二類預設字段至少包括郵件正文;
預處理模塊,對所述第二類預設字段的內(nèi)容進行預處理;
分類模型模塊,基于所述第二類預設字段的內(nèi)容的語種,分別輸入到基于不同語言的經(jīng)過訓練的標簽分類模型,獲得所述郵件文本內(nèi)容對應的至少一個標簽;
映射關系模塊,根據(jù)所述郵件文本內(nèi)容的標簽與預設標簽映射表的映射關系,獲得郵件處理流程信息;以及
郵件處理模塊,將所述郵件處理流程信息發(fā)送到預設的處理郵箱。
9.一種基于深度學習的郵件標簽設備,其特征在于,包括:
處理器;
存儲器,其中存儲有所述處理器的可執(zhí)行指令;
其中,所述處理器配置為經(jīng)由執(zhí)行所述可執(zhí)行指令來執(zhí)行權利要求1至7任意一項所述基于深度學習的郵件標簽方法的步驟。
10.一種計算機可讀存儲介質(zhì),用于存儲程序,其特征在于,所述程序被執(zhí)行時實現(xiàn)權利要求1至7任意一項所述基于深度學習的郵件標簽方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于攜程計算機技術(上海)有限公司,未經(jīng)攜程計算機技術(上海)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011344783.7/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





