[發(fā)明專利]分類器訓(xùn)練方法和裝置、身份驗證方法和系統(tǒng)有效
| 申請?zhí)枺?/td> | 201410242769.4 | 申請日: | 2014-06-03 |
| 公開(公告)號: | CN105260628B | 公開(公告)日: | 2019-01-11 |
| 發(fā)明(設(shè)計)人: | 劉杰;古開元;陸莉 | 申請(專利權(quán))人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F21/31 | 分類號: | G06F21/31 |
| 代理公司: | 廣州三環(huán)專利商標代理有限公司 44202 | 代理人: | 賈允;肖丁 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 分類 訓(xùn)練 方法 裝置 身份驗證 系統(tǒng) | ||
1.一種分類器訓(xùn)練方法,所述方法包括:
獲取訓(xùn)練樣本集;所述訓(xùn)練樣本集中的每個訓(xùn)練樣本包括用戶身份屬性和對應(yīng)預(yù)設(shè)分類條件特征的特征值;
根據(jù)一種所述預(yù)設(shè)分類條件特征確定根結(jié)點處的分類條件,包括:統(tǒng)計訓(xùn)練樣本集中每種預(yù)設(shè)分類條件特征的每種特征值所對應(yīng)的用戶身份屬性為合法用戶的訓(xùn)練樣本的數(shù)量,根據(jù)訓(xùn)練樣本集中對應(yīng)統(tǒng)計的數(shù)量最多的特征值所對應(yīng)的預(yù)設(shè)分類條件特征來確定根結(jié)點處的分類條件;
根據(jù)根結(jié)點處的分類條件將所述訓(xùn)練樣本集中的訓(xùn)練樣本進行分類,獲得對應(yīng)所述根結(jié)點的孩子結(jié)點的分類子集;將所述根結(jié)點的孩子結(jié)點作為當前結(jié)點;
根據(jù)另一種所述預(yù)設(shè)分類條件特征確定當前結(jié)點處的分類條件,包括:確定當前結(jié)點所對應(yīng)的除去已用于確定當前路徑中的結(jié)點處的分類條件的預(yù)設(shè)分類條件特征的剩余預(yù)設(shè)分類條件特征,統(tǒng)計當前結(jié)點所對應(yīng)的分類子集中每種所述剩余預(yù)設(shè)分類條件特征的每種特征值所對應(yīng)的用戶身份屬性為合法用戶的訓(xùn)練樣本的數(shù)量,根據(jù)當前結(jié)點所對應(yīng)的統(tǒng)計的數(shù)量最多的特征值所對應(yīng)的剩余預(yù)設(shè)分類條件特征來確定當前結(jié)點處的分類條件;
根據(jù)當前結(jié)點處的分類條件對當前結(jié)點所對應(yīng)的分類子集中的訓(xùn)練樣本進行分類,獲得對應(yīng)當前結(jié)點的孩子結(jié)點的分類子集;
將當前結(jié)點的孩子結(jié)點作為當前結(jié)點,繼續(xù)執(zhí)行所述根據(jù)另一種所述預(yù)設(shè)分類條件特征確定當前結(jié)點處的分類條件,根據(jù)當前結(jié)點處的分類條件對當前結(jié)點所對應(yīng)的分類子集中的訓(xùn)練樣本進行分類,獲得對應(yīng)當前結(jié)點的孩子結(jié)點的分類子集的步驟,直至當前結(jié)點所對應(yīng)的分類子集中各個訓(xùn)練樣本的相同的預(yù)設(shè)分類條件特征所對應(yīng)的特征值分別相同或者當前結(jié)點的層數(shù)達到指定層數(shù);
根據(jù)當前結(jié)點所對應(yīng)的分類子集中對應(yīng)最多訓(xùn)練樣本的用戶身份屬性確定當前結(jié)點處的用戶身份分類結(jié)果,獲得決策樹分類器。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取訓(xùn)練樣本集,包括:
獲取用于訓(xùn)練分類器的身份驗證數(shù)據(jù)樣本,所述身份驗證數(shù)據(jù)樣本包括用戶證據(jù)數(shù)據(jù)以及經(jīng)過驗證而確定的證據(jù)驗證結(jié)果和身份判定結(jié)果;
根據(jù)所述用戶證據(jù)和所述證據(jù)驗證結(jié)果提取對應(yīng)預(yù)設(shè)分類條件特征的特征值;
根據(jù)所述身份驗證數(shù)據(jù)樣本所對應(yīng)的提取的特征值和所述身份判定結(jié)果構(gòu)建訓(xùn)練樣本集中的訓(xùn)練樣本。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:
獲取檢驗樣本集;所述檢驗樣本集中的每個檢驗樣本包括用戶身份屬性和對應(yīng)預(yù)設(shè)分類條件特征的特征值;
根據(jù)所述檢驗樣本集中的每個檢驗樣本的特征值,從所述決策樹分類器的根結(jié)點處的分類條件開始逐層判斷分類直至葉結(jié)點,根據(jù)該葉結(jié)點處的用戶身份分類結(jié)果確定對應(yīng)所述每個檢驗樣本的身份判定結(jié)果;
根據(jù)所述檢驗樣本集中的檢驗樣本所對應(yīng)的身份判定結(jié)果和用戶身份屬性計算所述決策樹分類器的各個判斷路徑的準確率;
調(diào)整準確率低于預(yù)設(shè)準確率閾值的判斷路徑中的結(jié)點。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:獲取用戶反饋信息,根據(jù)所述反饋信息調(diào)整所述決策樹分類器中與所述反饋信息相關(guān)的判斷路徑中的結(jié)點。
5.一種身份驗證方法,所述方法包括:
接收用戶終端發(fā)來的攜帶有待驗證用戶標識和待驗證用戶證據(jù)數(shù)據(jù)的身份驗證請求;
獲取對應(yīng)所述待驗證用戶標識的用戶數(shù)據(jù),根據(jù)所述獲取的用戶數(shù)據(jù)對所述待驗證用戶證據(jù)數(shù)據(jù)進行驗證而獲得證據(jù)驗證結(jié)果;
根據(jù)所述待驗證用戶證據(jù)數(shù)據(jù)和所述獲得的證據(jù)驗證結(jié)果提取對應(yīng)預(yù)設(shè)分類條件特征的待驗證特征值;
從決策樹分類器的根結(jié)點處的分類條件開始,根據(jù)所述對應(yīng)預(yù)設(shè)分類條件特征的待驗證特征值逐層判斷分類直至葉結(jié)點,根據(jù)該葉結(jié)點處的用戶身份分類結(jié)果確定對應(yīng)所述待驗證用戶標識的身份驗證結(jié)果;所述決策樹分類器根據(jù)權(quán)利要求1-4中任意一項所述的分類器訓(xùn)練方法訓(xùn)練獲得。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于騰訊科技(深圳)有限公司,未經(jīng)騰訊科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410242769.4/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





