[發明專利]基于電子郵件地址和其他帳戶信息的用戶帳戶的基于機器學習的分類有效
| 申請號: | 201380005288.5 | 申請日: | 2013-01-09 |
| 公開(公告)號: | CN104054103A | 公開(公告)日: | 2014-09-17 |
| 發明(設計)人: | B·B·朱;F·薛 | 申請(專利權)人: | 微軟公司 |
| 主分類號: | G06Q40/02 | 分類號: | G06Q40/02;G06Q50/32 |
| 代理公司: | 上海專利商標事務所有限公司 31100 | 代理人: | 顧嘉運 |
| 地址: | 美國華*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 電子郵件地址 其他 帳戶 信息 用戶 機器 學習 分類 | ||
背景
在線交易通常需要在線帳戶。每一個在線帳戶都包含與帳戶的用戶有關的信息,諸如電子郵件地址、姓名、家庭地址、電話號碼等。為了避免被抓住并提高成功率,惡意用戶通常在短時間內將一帳戶用于非法用途并且然后切換至另一帳戶,由此需要大量帳戶。用于非法交易的帳戶可能是其它合法用戶的受損害的帳戶或者可由惡意用戶創建??墒褂米詣踊绦?即,機器人程序)來生成大量電子郵件地址以注冊這樣的欺詐性帳戶。例如,這些欺詐性帳戶可以與某些被盜的或非法信用卡相關聯以便在線進行欺詐性交易。諸如相關聯的電子郵件地址等與帳戶相關聯的信息被手動查閱以標識惡意帳戶,這是昂貴、勞動密集且耗時的。
概述
提供本概述以便以簡化的形式介紹將在以下詳細描述中進一步描述的一些概念。本概述并非旨在標識所要求保護的主題的關鍵特征或必要特征,也不旨在用于幫助確定所要求保護的主題的范圍。例如,術語“技術”可以指上述上下文和本公開通篇所準許的設備、系統、方法、和/或計算機可讀指令。
本發明提供了至少部分地基于包括電子郵件地址在內的信息和/或與傳入帳戶相關聯的其他附加信息來標識該帳戶是否是惡意的技術。這些技術從與帳戶相關聯的信息中提取特征,并應用分類模型以基于所提取的特征來生成指示傳入帳戶有多少可能是惡意的分數。這一分數可以至少部分地由電子郵件地址的可記性程度來確定。可記性指的是一個人記住電子郵件地址的容易度??捎浶猿潭瓤赏ㄟ^使用將人類生成的電子郵件地址與機器生成的電子郵件地址區分開的一個或多個特征來確定以生成電子郵件地址的可記性程度。另外,分數還可部分地由電子郵件地址的域來確定,并且可基于與帳戶相關的其他附加信息,諸如電子郵件地址與諸如姓名、電話和地址等其他帳戶信息的相關性,以幫助確定該帳戶是否是惡意的。例如,該分數還可部分地由除了與帳戶相關聯的電子郵件地址之外的信息來確定,諸如帳戶名稱、地址等是否匹配信用卡的對應信息、地址的有效性、帳戶已經創建多久,等等。
本發明的技術應用機器學習來學習從訓練數據中提取的將惡意帳戶與良性帳戶區分開的一個或多個特征,基于這些特征獲取分類模型,并且使用該分類模型自動確定指示傳入帳戶有多少可能是惡意的分數。分類模型可以用新數據來持續改進并進行增量式訓練。例如,可以從一個或多個在線交易的結果獲取的指示傳入帳戶是惡意的還是良性的該傳入帳戶的地面真值(ground?truth)可用于訓練分類模型以相應地調整分類模型。例如,傳入帳戶的地面真值可以與由分類模型確定的結果進行比較并且這一比較結果用于改進分類模型。
附圖簡述
參考附圖來描述具體實施方式。在附圖中,附圖標記中最左邊的數字標識該附圖標記首次出現的附圖。在各附圖中,使用相同的標號來指示相同的特征和組件。
圖1示出了基于帳戶的電子郵件地址和其他附加信息來確定該帳戶的分數的示例場景。
圖2示出了用于確定帳戶的分數的示例方法的流程圖。
圖3示出了用于機器學習以標識特征和生成分類模型的示例方法的流程圖。
圖4示出了用于持續訓練分類模型的示例方法的流程圖。
詳細描述
本發明技術至少部分地基于電子郵件地址的可記性程度來確定與電子郵件地址和其他附加信息相關聯的帳戶的分數。該分數確定該帳戶有多少可能是惡意的或良性的。另外,這些技術還可使用與帳戶和/或電子郵件地址相關聯的其他特征,諸如電子郵件地址的域、與帳戶和/或電子郵件地址相關聯的電話號碼和用戶名的相關性、或與帳戶相關聯的其他特征,來確定該帳戶的分數。
與良性帳戶相關聯的電子郵件地址通常是人類生成的,而與惡意帳戶相關聯的電子郵件地址通??赡苁菣C器生成的。人類生成的電子郵件地址通常是為了在一段時間內容易記住而選擇的。通常存在特定特征來幫助記憶,諸如有意義的串和數字、可發音的串、人類生成的電子郵件地址中的對稱性。它們的長度通常也是短的。當前機器生成的電子郵件地址通常缺少這些特征。在一些實施例中,一些電子郵件地址可通過可記性測試并且被認為是人類生成的,但在這些電子郵件地址的域或與電子郵件地址和/或帳戶相關聯的其他附加信息被確定為與惡意帳戶相關聯的情況下仍舊可被認為是與惡意帳戶相關聯的。在其他實施例中,除電子郵件地址之外的帳戶數據,諸如與帳戶相關聯的姓名及其與在線交易中所使用的信用卡的姓名的相關性、與帳戶相關聯的地址的有效性等,也可用于確定帳戶是惡意的可能性。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于微軟公司,未經微軟公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201380005288.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種用于測定羽毛絨濁度的濁度校準液
- 下一篇:一種Cuk型開關電源的控制系統





